序 


C++ 可 能 是 计算 机 历史 上 最 早 被 发 明 的 高 级 程序 语言 ， 同 时 也 是 当今 最 活跃 的 程序 设计 语言 之 一 。C++ 很 强大 ， 强 大 到 你 可 以 使 用 它 做 任何 层面 的 开发 ; C++ 也 很 脆弱 ， 脆 弱 到 需要 程序 员 自 己 去 控制 
内 存 回 收 ， 一 个 不 小 心 就 会 使 整个 程序 Core Dump。C++ 语 言 的 创始 人 Bjare Stroustrup 曾 私下 承认 ， 为 了 提高 C++ 程序 员 的 薪水 和 地 位 ， 在 设计 C++ 编译 器 版 本 过 程 中 有 意 地 增加 了 C++ 语言 的 难度 ， 使 
C++ 更 偏向 于 资深 程序 员 的 使 用 习惯 ， 提 高 学 习 门 槛 ， 从 而 增加 C++ 程序 员 的 身价 。 学 习 曲 线 的 增加 并 不 是 没有 任何 回报 的 ， 在 服务 端 后 台 开 发 、 处 理 多 并 发 的 海量 网 络 请 求 方面 ，C++ 语 言 有 天 然 的 优 
势 。 因 此 ， 当 应 用 的 用 户 量 、 并 发 量 迅速 增长 ， 达 到 一 定量 级 之 后 ， 后 端 服务 的 技术 架构 都 会 转变 为 Linux C++。 

要 做 一 名 优秀 的 使 用 C++ 进行 后 台 开 发 的 程序 员 ， 只 掌握 C++ 语言 是 远 远 不 够 的 ， 还 需要 掌握 如 何 进行 编译 、 链 接 、 调 试 ， 如 何 使 用 网 络 协议 、IO 模 型 和 一 些 常 用 的 类 库 ， 等 等 。 我 曾经 面试 过 不 少 后 
台 开 发 程序 员 ， 他 们 往往 很 重视 语言 本 身 ， 但 是 对 一 些 语言 之 外 的 东西 理解 不 够 透彻 ， 影 响 了 他 们 的 技术 发 展 。 我 也 读 过 不 少 相 关 方 面 的 技术 书籍 ， 往 往 都 过 多 地 停留 在 语言 层面 ， 忽 略 了 实际 开发 工作 中 
需要 用 到 的 知识 。 


晓 盆 在 腾讯 从 事 开发 工作 多 年 ， 有 丰富 的 后 台 开 发 经 验 ， 她 从 实际 的 后 台 开发 经 验 出 发 ， 讲 解 了 后 台 开发 中 需要 用 到 的 方方面面 的 知识 。 从 C++ 语言 出 发 ， 又 不 止 于 C++ 语言 ， 本 书 可 以 说 是 一 本 Linux 
C++ 后 台 开 发 的 实战 典范 。 当 知道 晓 侈 在 写 这 么 一 本 书 的 时 候 ， 我 真心 为 国内 的 众多 开发 者 感到 高 兴 。 如 果 读 者 有 意愿 成 为 一 名 从 事 Linux 后 台 开 发 的 程序 员 ， 本 书 无 疑 是 一 本 最 佳 的 参考 书籍 。 


研发 是 一 项 讲究 实战 的 工作 ， 一 切 不 从 实际 工作 出 发 的 技术 书籍 都 是 纸上谈兵 ， 没 有 实际 意义 。 一 本 优秀 的 技术 书籍 应 该 是 这 样 的 : 当 读者 按照 书 中 的 内 容 进行 实 操 的 时 候 ， 读 者 写 的 每 一 行 代码 都 是 
有 价值 的 ， 能 够 在 实际 工作 中 派 上 用 场 。 本 书 恰好 做 到 了 这 一 点 。 这 是 一 位 技术 书籍 作者 对 读者 的 起 码 诚 意 。 





软件 工程 师 是 一 种 需要 坚定 、 踏 实 、 精 益 求 精 的 “工匠 精神 ”的 职业 ， 心 浮 气 踩 、 得 过 且 过 的 态度 不 可 能 把 代码 写 好 。 老 一 草 的 人 说 “ 字 如 其 人 ”， 在 软件 领域 ， 我 们 同样 可 以 说 “代码 如 其 人 ”， 一 
个 人 的 行事 风格 和 为 人 态度 都 会 体现 到 他 所 写 的 代码 上 面 。 按 照 晓 侈 的 书 去 学 习 ， 读 者 可 以 潜移默化 地 学 习 到 她 多 年 后 台 开 发 所 炼 就 的 “工匠 精神 ”。 我 想 ， 相 对 于 所 学 习 到 的 知识 ， 这 于 一 个 工程 师 来 说 
更 为 重要 。 


黄 世 飞 


腾讯 云 平台 技术 总 监 


0.1 什么 是 后 台 开发 








听 到 “后 台 开 发 ”这 个 词 ， 估 计 读 者 心中 都 或 多 或 少 会 有 一 些 自己 的 感性 认识 ， 这 种 认识 可 能 有 一 些 差 别 ， 但 估计 大 部 分 人 都 有 这 么 一 种 看 法 : “后 台 开发 ”是 编写 一 些 用 户 看 不 见 的 程序 ， 也 就 是 非 
界面 的 程序 ， 既 不 是 网 页 ， 也 不 是 App， 更 不 是 桌面 程序 ， 因 为 这 些 都 是 用 户 看 得 见 的 (被 称 为 “前 台 开 发 ”) 。 这 种 感性 认识 在 一 定 程度 上 是 正确 的 ， 但 是 它 不 够 具体 ， 也 不 够 全 面 。 
































































































































我 们 这 里 所 说 的 “后 台 开发 ”的 确 是 用 户 “看 不 见 ” 的 部 分 ， 但 是 还 有 很 多 界面 性 的 程序 是 给 企业 内 部 人 员 使 用 的 ， 这 些 虽然 是 界面 程序 ， 但 是 对 于 最 终 用 户 来 说 也 是 “看 不 见 ”的 。 举 个 例子 ,开发 
一 个 电子 商务 网 站 ， 提 供给 客户 进行 商品 购买 的 网 页 是 用 户 看 得 见 的 ， 不 属于 “后 台 ”， 但 是 电 商 网 站 内 部 员工 使 用 的 “用 户 管理 系统 ”，“ 订 单 管 理 系统 ”等 ， 也 是 用 户 看 不 见 的 ， 但 它们 不 属于 本 书 中 
所 指 的 “后 台 ”。 在 某 些 场合 ， 或 者 某 些 人 的 习惯 中 ， 这 些 内 部 使 用 的 系统 也 叫 “ 后 台 ”， 这 几 种 说 法 都 没有 错 ， 希 望 读 者 在 听 到 的 时 候 ， 知 道 说 话 人 具体 指 的 是 什么 。 














































































































本 书 介绍 的 “后 台 开发 ” 指 的 是 “服务 端的 网 络 程序 开发 ”， 从 功能 上 可 以 具体 描述 为 : 服务 器 收 到 客户 端 发 来 的 请 求 数据 ， 解 析 请 求 数据 后 处 理 ， 最 后 返回 结果 ， 如 图 0-1 所 示 。 











FOO 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


SERVER 





LN3al 12 


IEAS 





图 0-1 后台 开发 的 步骤 





这 里 的 SERVER 就 是 本 书 所 指 的 “后 台 程 序 ”， 或 者 “服务 器 ”。SERVER 接 收 请 求 的 方式 既 可 以 是 通过 TCP 请 求 包 ， 也 可 以 是 HTTP 请 求 包 (其 实 也 是 TCP 连 接 ) 。 如 果 是 TCP 请 求 ， 二 进 制 的 格式 会 常 
见 一 些 ; 如 果 是 HTTP 方 式 的 请 求 ， 请 求 包 的 格式 一 般 是 JSON 或 者 XML， 或 者 自 定义 的 AsCll 文 本 。 解 析 请 求 包 的 方式 自然 是 与 请 求 包 的 格式 相对 应 的 ， 接 收 到 的 是 什么 格式 的 包 ， 就 用 对 应 的 格式 解析 
(如 果 是 自 定义 的 格式 ， 就 按照 自 定义 的 方式 去 解析 ) 。 “处 理 请 求 ”这 一 步 是 后 台 程 序 的 具体 业务 逻辑 的 体现 。 很 多 封装 好 的 后 台 框架 会 把 其 他 三 步 都 做 好 ， 但 是 这 一 步 还 是 需要 开发 者 自己 去 实现 ， 因 
为 只 有 开发 者 自己 清楚 ， 程 序 是 要 去 做 “登录 ”还 是 去 做 “注册 ”的 事情 。 “输出 回复 包 ” 和 “接收 请 求 包 ” 是 对 应 的 ， 一 般 来 说 ， 收 到 的 是 JSON， 那 么 回复 的 也 是 JJON， 收 到 的 是 XML， 那 么 发 送 的 也 
是 XML， 其 他 格式 也 是 一 样 的 。 这 四 个 步骤 是 所 有 后 台 程 序 都 会 有 的 ， 无 论 使 用 什么 语言 去 实现 ， 都 可 以 看 到 这 四 个 步骤 的 影子 。 






























































CLIENT 指 的 是 向 SERVER 发 起 请 求 ， 并 接收 SERVER 回复 的 一 方 ， 通 常 称 为 “客户 端 ”。 既 然后 台 程 序 是 通过 TCP 或 者 HTTP 接 收 和 回复 消息 的 ， 那 么 只 要 是 能 够 发 起 TCP 或 者 HTTP 连 接 的 都 可 以 作为 客 
户 端 ， 可 以 是 浏览 器 、PC 端 的 程序 、 安 卓 应 用 、1OS 应 用 ， 























0.2 ”时 间 就 是 金钱 ， 效 率 就 是 生命 

















上 世纪 80 年 代 ， 在 改革 开放 初期 的 深圳 蛇口 ， 为 了 加 快 蛇 口 港 的 建设 ， 一 块 “ 时 间 就 是 金钱 ， 效 率 就 是 生命 ”的 巨 幅 标语 章 立 在 蛇口 工业 区 的 马路 边 (如 图 0-2 所 示 ) ， 拉 开 了 特区 建设 的 序幕 。 









































图 0-2 1981 年 意 立 在 深圳 蛇口 工业 区 的 巨 幅 标语 



































其 实 这 个 口号 后 面 还 有 两 句 : “安全 就 是 法 律 ， 顾 客 就 是 皇帝 ”， 这 四 和 句 加 一 起 ， 简 直 就 是 当今 互联 网 时 代 科技 公司 安身 立 命 的 根本 。 互 联网 最 讲究 效率 并 且 一 切 都 从 用 户 体验 出 发 。 在 腾讯 、 百 度 和 


阿里 这 样 的 互联 网 公司 里 ， 每 一 次 的 版 本 发 布 都 是 和 时 间 在 赛跑 。 各 种 以 效率 为 核心 的 开发 团队 合作 模式 被 创造 : 敏捷 开发 、 极 限 编程 、SCRUM、 结 对 编程 ， 双 周 迭 代 ， 等 等 。 


写 下 这 些 文字 的 时 候 是 我 在 腾讯 工作 的 第 五 个 年 头 ， 这 五 年 让 我 对 效率 有 了 更 深刻 的 认识 。 还 是 一 个 学 生 的 时 候 ， 和 大 家 一 样 ， 我 也 曾 一 字 不 落地 读 过 《UNIX 环 境 高 级 编程 》，《UNIX 环 境 网 络 编 
程 》 一 二 三 卷 ，《TCP/IP 详 解 》 一 二 三 卷 ， 《C++Primer》 等 书籍 ， 这 些 都 是 非常 经 典 的 开发 书籍 。 它 们 的 共同 特点 是 大 而 全 ， 不 漏 掉 任何 一 个 知识 点 ， 并 且 每 个 知识 点 都 讲 得 非常 详细 。 但 在 实际 的 开发 












































工作 中 ， 可 能 用 到 的 知识 点 只 有 20%， 其 他 的 80% 则 很 少 用 到 。 这 也 是 我 写 这 本 书 的 初 训 : 用 最 短 的 篇 幅 ， 讲 解 实际 后 台 开 发 中 














到 的 核心 知识 点 ， 



































也 许 有 读者 会 觉得 这 很 急功近利 ， 不 利于 组 建 完整 的 知识 体系 。 其实， 软件 开发 是 一 门 讲究 实 操 的 技术 ， 知 道 多 少 并 不 
码 ， 那 可 以 认为 是 没有 读 。 边 写 代码 边 读书 才 是 最 好 的 学 习 方 式 ， 在 读 一 本 技术 书籍 的 时 候 ， 最 好 让 自己 快速 并 入 写 代码 的 思 坊 





的 学 习 过 程 实际 上 更 有 利于 完善 自己 的 知识 体系 。 





接 下 来 简单 介绍 一 下 后 台 开发 的 知识 体系 ， 也 就 是 说 ， 要 完整 掌握 后 台 开 发 ， 需 要 掌握 哪些 知识 点 ， 这 些 知 识 点 也 是 本 书 会 讲解 到 的 知识 点 。 图 








以 上 这 六 部 分 知识 点 会 是 本 书 将 会 覆盖 的 内 容 。 与 专门 介绍 某 一 类 知识 的 书籍 不 同 ， 比 如 《C++Primer》 介 绍 C++ 的 方 方 面 





























慢 慢 补 全 。 


重要 的 是 能 够 用 好 


让 读者 可 以 快速 进入 到 实际 的 开发 工作 中 。 


多 少 。 如 果 把 一 本 经 典 书籍 读 3 遍 ， 但 是 没有 写 过 一 行 代 

















一 边 写 代码 ， 一 边 通读 书籍， 在 具体 需要 用 到 书 上 某 个 技术 点 的 时 候 ， 再 
回头 仔细 阅读 相关 的 章节 。 在 这 个 循环 往复 的 过 程 中 ， 才 能 把 书 上 的 知识 点 转化 为 自己 的 知识 点 。 完 成 多 个 这 样 的 循环 后 ， 再 回 过 头 来 审视 自己 已 经 掌握 的 知识 点 ， 把 一 些 没有 掌握 的 知识 点 搞 清楚 。 这 样 














0-3 展 示 了 对 后 台 开 发 知识 体系 一 个 比较 全 面 的 梳理 。 





面 ，《UNIX 环 境 编程 》 介 绍 UNIX 环 境 编程 的 方方面面 ， 本 书 从 “实战 ”的 
角度 出 发 ,介绍 “后 台 开 发 ”需要 用 到 的 知识 和 工具 。 读 完 本 书 ， 读 者 可 能 不 会 对 C++ 精 通 ， 不 会 对 Linux 精 通 ， 也 不 会 对 TCP/IP 精 通 ， 但 是 却 可 以 学 会 如 何 进行 “后 台 开 发 ”， 这 些 “ 精 通 ” 可 以 一 个 个 














东 掌 握 函 数 、 数 组 、 指 针 







掌握 构造 本数 





需 能 熟练 使 面向 对 象 














学 撒 string\vectormap\set 的 使 用 和 原理 
使 用 时 需 注意 的 细节 





STL 的 使 用 一 一 


了 解 编译 与 链接 过 程 中 都 发 生 了 些 什么 —— 编译 与 链接 一 


能 熟练 地 编写 Makefile 一 Makefile 的 编写 — 

了 解 ELF 文 件 类 型 

了 解 西 种 视图 下 ELF 文 件 和 ud 目标 文件 — 
了 解 处 理 目 标 文件 相关 工具 





深入 了 “ 解 TCP 协 议 Maie í 


STER 






TCP 协 议 
了 解 网 络 字 
需要 可 以 轻松 地 写 出 


WERE "T 
-个 客户 端 和 服 

了 解 网 络 
知 | 道 select\poll\epoll 的 使 用 方法 和 原 百 
别 一 一 


东 使 用 pingNcpdumpmetstatysof 这 四 款 工 具 一 一 
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网 络 IO 模 型 





了 解 select\poll\epoll 的 区 . 





gr rH. 


图 0-3 ”后 台 开 发 工程 师 技术 能 力 体系 图 





细心 的 读者 可 能 会 发 现 ， 编 程 语言 和 编辑 器 只 是 其 中 的 一 小 部 分 ， 要 把 后 台 开 发 做 好 ， 
程序 开发 的 最 大 特点 ， 既 要 掌握 理论 的 东西 ， 也 要 掌握 相应 的 工具 ， 这 样 才能 把 理论 的 知识 











需要 掌握 的 东西 比 想象 中 的 要 多 。 同 时 ， 这 些 知 识 点 既 有 一 些 纯 理解 性 的 内 容 








掌握 JSON 的 结构 
[— JSON [sow 库 的 使 用 


JSON 的 用 途 


—— Protobuff 上 





了 解 Protobuff 的 特点 
东 使 用 Protobuff 
了 解 Protobuff 的 用 途 





HTTP 协 议 结构 
HTTP 协 议 
[m 
CGT p — *ECGI(I EiHEdE ut 






SSGETRIPOST £t 
了 解 FASTCGI 是 什么 


9 使 用 





FASTCGI 




















多 线程 
à 程 的 创 " Hj T 
IRE - 尸 进程 和 守护 进程 
用 daemon 阴 数 


共享 内 存 和 信 
列 





的 使 用 





， 也 有 一 些 工 具 性 的 东西 。 这 也 是 


























起 来 。 在 实际 开发 中 ， 








这 些 工 具 
产 出 ， 才 是 开发 者 最 终 需要 的 。 


0.4 ”如 何 阅读 本 书 





本 书 以 C++ 为 编程 语言 ， 





讲述 后 台 开发 的 核心 技术 与 应 











实践 。 全 书 共 13 章 ， 在 逻辑 上 分 为 以 下 六 部 分 : 























































































































性 的 知识 可 能 











为 理论 是 脑子 里 想 的 ， 但 工具 产生 的 东西 才 是 真正 的 















































































































































第 一 部 分 为 第 1~3 章 ， 主 要 是 编程 语言 方面 的 知识 ， 包 括 函 数 、 函 数 重 载 、 函 数 模板 、 数 组 、 指 针 、 引 用 、 结 构 体 和 预 处 理 的 使 用 ; 面向 对 象 的 介绍 ， 包 括 类 的 使 用 、 继 承 与 派生 和 类 的 多 态 ; 常用 STL 
的 介绍 ， 包 括 string、vector、map 和 set 的 使 用 方法 与 原理 。 如 果 读 者 已 经 对 C++ 非常 了 解 ， 可 以 跳 过 这 部 分 ， 也 可 以 配合 《C++Primer》 一 起 阅读 。 
二 部 分 为 第 4~5 章 ， 主 要 是 编译 原理 和 调试 方法 相关 的 知识 。 编 译 原理 相关 知识 包含 编译 与 链接 的 具体 过 程 ，makefile 的 编写 、 目 标 文件 的 内 容 与 处 理 目标 文件 相关 工具 的 使 用 ;调试 方法 相关 内 容 
主要 介绍 了 用 strace 分 析 系 统 调 gdb 调 试 进程 与 分 析 coredump 文 件 、 用 top 命 令 分 析 系统 负载 情况 、 用 ps 命令 查看 系统 进程 和 用 valgrind 工 具 分 析 进 程 的 内 存 使 用 情况 等 。 
第 三 部 分 为 第 6~8 章 ， 主 要 是 网 络 相关 的 知识 ， 包 括 TCP 协 议 的 关键 知识 点 和 TCP server 的 实现 ， 网 络 1O 模 型 和 select、poll 与 epoll 三 个 重要 函数 的 使 用 ， 还 有 ping、tcpdump、netstat 和 lsof 这 四 个 
网 络 分 析 工 具 的 使 用 。 掌 握 这 部 分 知识 ， 读 者 可 以 自己 独立 实现 能 处 理 海量 请 求 的 TCP server, 











第 四 部 分 为 第 9~11 章 ， 主 要 是 多 线程 、 


境 高 级 编程 》 一 起 阅读 。 


进程 和 进程 间 通 信 相 关 的 知识 ， 包 括 多 线程 的 使 用 、 多 线程 的 同步 和 重 入 问题 ， 父 子 进程 、 





僵 






























































尸 进程 、 守 护 进 程 和 进程 间 通 信和 的 方式 。 读 者 可 以 配合 《UNIX 环 














第 五 部 分 是 第 12 章 ， 主 要 是 HTTP 协 议 的 介绍 与 使 用 、CGI 的 设计 原理 与 实现 和 FASTCGI 的 简单 介绍 。 掌 握 这 部 分 知识 ， 读 者 可 以 轻松 实现 Web 应 用 的 后 台 交 互 部 分 。 
第 六 部 分 是 第 13 章 ， 通 过 常用 类 库 JsonCPP 和 Protobuf 的 使 用 ， 演 示 如 何 使 用 第 三 方 库 。 
如 果 读 者 是 后 台 开 发 的 新 手 ， 建 议 从 第 1 章 开始 阅读 ， 如 果 读 者 已 经 有 后 台 开 发 的 经 验 ， 可 以 直接 选择 感 兴趣 的 章节 阅读 。 





0.5 ”勘误 和 资源 


由 于 水 平 有 限 ， 加 之 编写 时 间 仓 促 ， 书 中 难免 会 出 现 一 些 错误 或 者 不 准确 的 地 方 ， 妨 请 读者 批评 指正 。 为 了 更 好 地 与 读者 交流 ， 我 专门 创建 了 一 个 微 信 公众 号 ， 读 者 可 以 通过 以 下 二 维 码 关注 ， 与 我 进 


行 交流 。 





书 中 的 全 部 源 代码 可 以 从 华章 网 站 ( 


先 














感谢 腾讯 公司 ， 让 我 可 以 在 后 台 开 发 的 领域 里 驰 对 。 





其 次 要 感谢 机 械 了 








[ 业 出 版 社 华章 公司 的 杨 福 川 、 高 婧 牙 和 李 艺 ， 感 谢 你 们 在 我 写作 过 程 q 
说 以 此 书 献 给 我 亲爱 的 家 人 ， 以 及 热爱 软件 开发 的 








提供 的 支持 ， 因 为 有 了 你 们 的 鼓励 和 帮助 ， 我 才能 顺利 完成 全 部 书稿 。 
肥 们 ! 
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英语 、 


+ 
月 ， 


选择 任意 一 种 语言 去 与 他 人 交流 。 同 样 ， 我 们 也 可 以 通过 “语言 ”来 影响 计算 机 ， 让 计算 机 为 我 们 做 事 


C 语 言 是 1972 年 由 美国 贝尔 实验 室 






法 语 、 韩 语 等 ， 虽 然 它 们 的 词汇 和 格式 都 不 一 样 ， 但 是 可 以 达到 同样 的 目的 ， 我 们 可 以 
这 样 的 语言 就 叫 作 编程 语言 。 

的 D.M.Ritchie 设 计 成 功 的 ， 它 是 为 计算 机 专业 人 员 设计 的 ， 大 多 数 系 统 软 件 和 许多 应 用 软件 都 是 用 C 语 言 编写 的 。 但 是 随 着 软件 规模 的 增 大 ， 用 C 语 言 编写 程序 渐渐 显 
得 有 些 吃 力 了 。C++ 也 是 由 美国 贝尔 实验 室 的 Bjarne Stroustrup 博 士 及 其 同事 于 20 世 纪 80 年 代 初 在 C 语 言 的 基础 上 开发 成 功 的 。C++ 保 留 了 C 语 言 原 有 的 所 有 优点 ， 与 C 语 言 兼 容 ， 并 且 增 加 了 面向 对 象 的 机 
制 。 用 C 语 言 写 的 程序 基本 上 可 以 不 加 修改 地 用 于 C++ 开发 工具 。 从 C++ 的 名 字 可 以 看 出 它 是 

程序 设计 语言 。 


它 是 C 的 


C 的 超 集 。C++ 了 既 可 用 于 面向 过 程 的 结构 化 程序 设计 ， 又 可 用 于 面向 对 象 的 程序 设计 ， 是 一 种 功能 强大 的 混合 型 


本 章 主 要 讲述 C++ 中 的 常用 技术 ， 让 读者 可 迅速 地 、 由 浅 入 深 地 热 悉 这 门 语 言 。 


11 第 一 个 C++ 程序 














刚 开始 接触 一 门 编程 语言 ， 一 般 会 从 写 一 个 输出 Hello world 的 程序 开始 。 




















【 例 1.1】 程序 输出 Hello world。 


#include<iostream> 
using namespace std; 
int main () 


{ 
cout««"Hello world."««endl; 


return 0; 


l 





成 a.out 文 件 。 执 行 ./a.out 命 令 ， 即 可 得 到 和 输出 结果 : Hello 





把 上 述 程序 编写 在 一 个 叫 helloworld.cpp 的 文件 中 ， 并 将 它 放 到 Linux 机 器 上 的 某 个 目录 下 ， 执 行 g9+ +helloworld.cpp 命 令 ， 会 在 该 目录 下 4 








world.。 
先 看 程序 的 第 一 行 (finclude«iostream») ， 这 不 是 一 个 C++ 语句 ， 是 一 个 预 处 理 语 句 ， 编 译 器 的 预 处 理 器 把 输入 输出 流 的 标准 头 文件 包括 在 本 程序 中 ， 所 以 不 需要 在 句 末 加 分 号 (; ) 。include 一 


个 文件 ， 就 是 把 这 个 文件 的 所 有 内 容 都 加 进来 。 图 1-1 展 示 了 包含 文件 的 过 程 。 


filel.cpp 




















&include"file2.h" 
&include"fileScpp" | __ 


A 





file2.h filel.cpp 


B 
| C 
A 
file3.cpp 


e ET 


图 1-1 include x: £F 45/8 ££. 





如 图 1-1 所 示 ，include 一 个 .h 文 件 ， 就 是 等 于 把 整个 .h 文 件 给 复制 到 程序 中 ，include 一 个 .cpp 文 件 也 是 如 此 。 








来 包含 系统 提供 的 头 文件 ， 编 译 器 会 到 保存 系统 标 





























ude"" 的 方式 来 包含 一 个 头 文件 。 而 #include< > 与 #include"" 的 区 别 是 : #include<> 常 
录 是 否 有 指定 名 称 的 头 文件 ， 然 后 从 标准 头目 录 中 进行 查找 。 


Hiostream.h 是 两 个 不 同 的 文件 ， 前 者 没有 





























除了 #include< > 的 方式 来 包含 一 个 头 文件 ， 还 会 见 到 #inc 
准 头 文件 的 位 置 查找 头 文件 ;而 #include"" 常 用 于 包括 程序 员 自 己 编号 的 头 文件 ， 用 这 种 格式 时 ， 编 译 器 先 查 找 当前 




































































因为 iostream 和 和 




















事实 上 ，#include<iostream> 和 #include<iostream.h> 是 不 一 样 的 ， 














还 经 常会 看 到 #include<iostream> 和 #include<iostream.h> 的 使 用 。 











































































































































































































后 缀 。 实 际 上 ， 在 你 的 编译 器 include 文 件 夹 里 面 可 以 看 到 ， 两 个 文件 打开 后 ， 里 面 的 代码 是 不 一 样 的。 后缀 为 .h 的 头 文件 在 C+ + 标准 已 经 明确 提出 不 再 支持 了 ， 早 些 的 C 语 言 为 了 实现 将 标准 库 功能 定义 在 
全 局 空间 里 ， 声 明 放 在 在 带 .h 后 缀 的 头 文件 里 。 C++ 标准 为 了 和 (语言 区 别 开 ， 也 为 了 正确 使 用 命名 空间 ， 规 定 头 文件 不 再 使 用 后 缀 .h。 因 此 ， 当 使 用 <iostream.h> 时 ， 相 当 于 在 C 中 调用 库 函 数 ， 使 用 的 
是 全 局 命名 空间 ， 也 就 是 早期 的 C++ 实现 方法 。 换 名 话说 ，iostream 是 iostream.h 的 升级 版 ， 大 部 分 的 头 文件 都 有 一 个 不 带 .h 扩 展 名 的 文件 与 之 相对 应 。 不 过 有 个 特例 ，<string> 并 非 <string.h> 的 升级 
版 。 

再 看 程序 的 第 二 行 : "using namespace std; ”中 使 用 了 命名 空间 std。 命 名 空间 是 为 了 让 大 量 类 名 共存 而 不 至 于 引起 冲突 而 设计 的 。C+ + 标准 函数 库 的 所 有 元 素 都 被 声明 在 一 个 命名 空间 中 ， 这 就 是 
std 命 名 空间 。 为 了 能 够 访问 它 的 功能 ， 使 用 这 条 语句 来 表达 将 使 用 标准 名 空间 中 定义 的 元 素 。 这 条 语句 在 使 用 标准 函数 库 的 C+ + 程序 中 频繁 出 现 ， 本 书 中 大 部 分 例子 的 代码 中 也 将 用 到 它 ， 需 要 注意 的 是 ， 
最 好 不 要 在 头 文件 中 使 用 命名 空间 ， 否 则 容易 造成 命名 冲突 。 

继续 看 程序 的 第 三 行 : "int main () ”， 这 是 主 函 数 (main function) 的 起 始 声明 。 主 函数 是 所 有 C++ 程序 的 运行 的 起 始点 。 不 管 它 是 在 代码 的 开头 、 结 尾 还 是 中 间 ， 此 函数 中 的 代码 总 是 在 程序 








开始 运行 时 第 一 个 被 执行 。main 后 面 跟 了 一 对 
跟 在 它 的 声明 之 后 ， 由 花 括号 {} 括 起 来 。 








H 











程序 的 第 四 行 : 


"cout« «"Hello world."<<endl; ”是 本 程序 中 最 重 


括号 () ， 表 示 它 是 一 个 函数 。C+ + 中 所 有 函数 都 中 有 一 对 贺 











cout 在 的 声明 在 头 文件 jostream 中 ， 所 以 要 想 使 
常 犯 的 错误 之 一 就 是 忘记 在 语句 末尾 写 上 分 号 。 





最 后 一 行 (return 0; ) 中 返 





回 








在 后 面 的 例子 中 会 看 到 所 有 C++ 程序 都 以 类 似 的 语 





1.2 RŽI 


1. 函 数 的 定义 








括号 () ， 括 号 中 可 以 有 一 些 输入 参数 。 如 例 1.1 中 显示 ， 主 函数 (main function) 的 内 容 紧 


要 。 cout 是 C+ + 中 的 标准 输出 流 (通常 为 控制 台 ， 即 屏幕 ) ， 这 句 话 把 一 串 字符 串 (本 例 中 为 Hello World) 插入 到 输出 流 中 。 











cout 必 须 将 该 头 文件 包括 在 程序 开始 处 。 注 意 这 个 句子 以 分 号 结 














句 结束 。 


尾 。 分 号 标示 了 一 个 语句 的 结束 ，C++ 的 每 一 个 语句 都 必须 以 分 号 结尾 。C+ + 程序 员 最 


语句 (return) 标志 主 函 数 main () 执行 结束 ， 并 将 该 语句 后 面 所 跟 代 码 (在 本 例 中 为 0) 返回 。 这 是 在 程序 执行 没有 出 现任 何 错误 的 情况 下 最 常见 的 程序 结束 方式 。 





























































































































一 个 程序 是 由 若干 个 函数 组 成 的 ，C 语 言 被 认为 是 面向 函数 的 语言 ， 而 C++ 面向 过 程 的 程序 设计 也 沿用 了 (C 语 言 使 用 函数 的 方法 。 在 C+ + 面向 对 象 的 程序 设计 中 ， 主 函数 以 外 的 函数 大 多 是 被 封装 在 类 
中 的 。 主 函数 或 其 他 函数 可 以 通过 类 对 象 调用 类 中 的 函数 。 无 论 是 C 还 是 C+ + ， 程 序 中 的 各 项 操作 基本 上 都 是 由 函数 来 实现 的 ， 程 序 编写 者 要 根据 需要 编写 一 个 个 函数 ， 每 个 函数 用 来 实现 某 一 功能 。 因 
此 ， 读 者 必须 掌握 函数 的 概念 以 及 学 会 使 用 和 设计 函数 。 

定义 函数 的 一 般 格式 是 : 








返回 值 类 型 ACE (DAT) 


S ACA 





















































在 定义 函数 时 函数 名 后 面 括号 中 的 变量 名 称 是 形 参 。 在 主 调 中 调用 一 个 函数 时 ， 函 数 名 后 面 括 号 中 的 参数 是 实 参 。 
【 例 1.2】 函数 、 形 参 、 实 参 的 使 用 举例 。 
#include<iostream> 
using namespace std; 
int min(int a,int b){ // 这 里 的 min 就 是 函数 名 ，a、Db 是 形 参 ， 
// 返回 值 是 一 个 int 整 型 


if (a<b) return a; 
else return b; 

} 

int main (){ 
int a=10,b=1; 
cout««min (a,b) ««endl; 
return 0; 


函数 的 执行 结果 是 : 


// 这 里 的 a、b 是 实 参 




















































































































例 1.2 中 定义 了 一 个 函数 ， 有 2 个 整 型 的 参数 ， 且 返回 值 是 整 型 的 ， 在 main 函 数 中 调用 min 函 数 时 ， 传 入 的 是 实 参 。 

形 参 与 实 参 的 区 别 是 : 形 参 只 有 被 调用 时 才 分 配 内 存单 元 ， 在 调用 结束 时 ， 立 即 释放 所 分 配 的 内 存单 元 。 实 参与 形 参 的 类 型 应 相同 或 赋值 兼容 。 
2. 函 数 重 载 

C++ 允许 用 同一 函数 名 定义 多 个 函数 ， 但 这 些 函 数 必须 参数 个 数 不 同 或 类 型 不 同 ， 这 就 是 函数 重 载 。 例 1.3 说 明了 函数 重 载 的 使 用 方法 。 
[011.3] ” 求 不 同类 型 的 数 中 的 最 小 者 。 


#include<iostream> 

using namespace std; 

int min(int a, int b, int c)( 
if (a>b) a=b; 
if(a»c)a-c 

return a; 


} 
long long min(long long a,long long b, 


// 与 上 面 那个 函数 的 差别 


if (a>b) a=b; 
if (a>c)a=c; 
return a; 


l 

double min (double a, double b){ 
if (a-b» (1e-5))a-b; 
return a; 


int main(){ 
int a-1,b-22,c-3; 
cout««min (a, b, c) ««endl; 
long long a1-100,b1-200,c1-300; 
cout««min (a1,b1, c1)««endl; 
double a2-1.1,b2-2.2; 
cout««min (a2,b2) ««endl; 
return 0; 


long long c){ 
是 参数 的 类 型 不 同 


// 这 个 函数 与 以 上 的 差别 是 只 有 2 个 参数 





程序 的 执行 结果 是 : 






































函数 重 载 时 ， 同 名 函数 的 功能 应 当 相同 或 相近 ， 不 


















































函数 模板 ， 实 际 上 是 建立 一 个 通 
函数 ， 实 际 使 用 时 只 需 在 模板 中 定义 一 次 就 可 以 了 。 在 调 



































定义 函数 模板 的 一 般 格式 是 : 


函数 ， 其 函数 类 型 和 形 参 不 具体 指定 ， 而 











一 个 虚拟 的 类 型 来 代表 ， 这 个 通 
函数 时 ， 系 统 会 根据 实 参 的 类 型 来 取代 模板 中 的 虚拟 类 型 ， 从 而 实现 不 同 函 数 的 功能 。 











且 函 数 名 都 是 一 样 的 ， 不 过 参数 个 数 不 一 样 或 者 参数 类 型 不 一 样 ， 这 就 是 使 























同一 函数 名 去 实现 几 个 完全 不 相干 的 功能 ， 这 样 虽然 程序 能 运行 ， 但 是 可 读 性 不 好 ， 会 让 人 觉得 莫名 其 妙 。 











函数 就 是 函数 模板 。 凡 是 函数 体 相同 的 函数 都 可 以 

















了 函数 重 载 














这 个 模板 来 代 蔡 ， 而 不 





定义 多 个 











template«typename T» 














下 面 的 程序 说 明了 函数 模板 的 使 用 方法 。 




















【 例 1.4】 函数 模板 使 








举例 。 








#include<iostream> 
using namespace std; 
template«typename T» 
T min(T aT b,T c)( 
if (a>b) a=b; 
if (a>c)a=c; 
return a; 
int main (){ 
int a=1,b=2,c=3; 
cout<<min (a,b, c) ««endl; 
long long a1-1000000000,01-2000000000, c1-3000000000; 
cout««min (al,bl,c1)««endl; 
return 0; 





程序 输出 结果 : 





1 
1000000000 











例 1.4 中 定义 了 一 个 函数 模板 ， 
不 同 的 函数 了 ， 只 需 一 个 函数 模板 出 














可 搞定 。 





在 编写 函数 模板 时 ， 可 以 先 写 一 个 函数 ， 然 后 把 其 中 的 变量 类 型 都 蔡 换 成 虚拟 类 型 即 可 。 可 以 看 到 ， 


来 获得 3 个 数 中 的 最 小 者 。 若 传 入 3 个 整 型 的 ， 函 数 就 将 虚拟 类 型 T 转 成 int 去 执行 ， 若 传 入 3 个 长 整 型 的 ， 函 数 就 将 T 转 化 成 long long 去 执行 。 这 样 就 可 以 不 














1.3 数组 


1 数组 的 定义 





数组 是 相同 类 型 数据 的 集合 。 引 入 数组 就 不 需 
数组 有 关 。 熟 练 地 利 





























【 例 1.5】 ”一 维 数组 与 二 维 数组 使 





举例 。 





数组 ， 可 以 大 大 地 提高 编程 的 效率 ， 加 强 程序 的 可 读 性 。 例 1.5 


在 程序 中 定义 大 量 的 变量 ， 大 大 减少 程序 中 变量 的 数量 ， 使 程序 精炼 ， 而 且 数 组 含义 清楚 ， 














函数 模板 比 函 数 重 载 更 方便 ， 但 是 它 只 适 


























使 




















展示 了 数组 的 使 


方法 。 


























定义 类 型 





于 函数 个 数 相 同 而 类 型 不 同 的 情况 。 


方便 ， 明 确 地 反映 了 数据 间 的 联系 。 许 多 好 的 算法 都 与 





#include<iostream> 
using namespace std; 
int main(){ 
int a[10]-(1,2,3,4,5,6,7,8,9,10 


) 
// 数组 ar 类 型 为 int 整 型 ， 有 10 个 元 素 ， 


int izj; 
for (i=0;i<10; i++) { 
cout««a[i]««" "; 


// 从 a[0]~a[9] 


cout««endl; 
int b[21[2]-(1,2,3, 4); 
for (i=0;i<2; i++) { 
for (j=0;j<2;j++) { 
cout««b[i][j]««" "; 


cout««endl; 


return 0; 


是 一 个 一 维 数组 


// 数组 b， 类 型 为 int， 有 4 元 素 ， 是 一 个 二 维 数 组 





程序 的 执行 结果 是 : 





例 1.5 中 数组 a 是 一 个 一 维 数组 ， 有 一 个 下 标 ; 数组 b 是 一 个 二 维 数组 ， 有 两 个 下 








一 个 数组 在 内 存 中 占 








2004，af[2] 的 地 址 就 是 2008，a[3] 的 地 址 就 是 2012.…… 如 此 类 推 。 这 呈 


的 存储 单元 是 连续 的 ， 也 就 是 说 一 个 数组 在 内 存 中 占 


标 。 














时 的“ 地址” ， 大 家 可 以 简 和 











理解 为 在 内 存 中 的 一 个 标识 ， 详 细 内 容 会 在 本 章 的 1.4 节 中 进行 介绍 。 


一 片 连续 的 存储 单元 。 在 32 位 的 机 器 上 ， 一 个 int 类 型 的 值 占 4Byte， 如 果 a[0] 的 地 址 是 2000， 那 么 a[1] 的 地 址 就 是 


2. 字 符 数组 











字符 数组 ， 就 是 一 个 用 来 存放 字符 数据 的 数组 ， 示 例如 下 : 











char str[10]-"Book"; 














其 中 ，str 就 是 一 个 字符 数组 ， 并 且 str[0]='B'，str[1]='0'，str[2]='o'，str[3]='k'。C++ 中 用 \0' 来 标识 一 个 字符 串 的 结束 ， 这 里 ，str[4]~str[9] 都 是 \0'。 通 常用 strlen () 函数 来 计算 一 个 字符 串 的 长 
Æ, 故 strlen (str) 的 值 是 4。 与 strlen () 函数 比较 容易 混淆 的 是 sizeof () 函数 ， 这 里 sizeof (str) 的 值 是 10。 

















strlen 与 sizeof 的 区 别 如 下 所 示 : 








(1) strlen () 是 函数 ， 在 运行 时 才能 计算 。 参 数 必须 是 字符 型 指针 (char*) ， 且 必须 是 以 \0 结尾 的 。 当 数组 名 作为 参数 传 入 时 ， 实 际 上 数组 已 经 退化 为 指针 了 。 它 的 功能 是 返回 字符 串 的 长 度 。 

















(2) sizeof () 是 运算 符 ， 而 不 是 一 个 函数 ， 在 编译 时 就 计算 好 了 ， 用 于 计算 数据 空间 的 字 节 数 。 因 此 ，sizeof 不 能 用 来 返回 动态 分 配 的 内 存 空 间 的 大 小 。sizeof 常 用 于 返 
结构 或 数组 所 占 的 空间 ， 返 回 值 跟 对 象 、 结 构 、 数 组 所 存储 的 内 容 没 有 关系 。 






































回 





类 型 和 静态 分 配 的 对 象 、 








当 参 数 分 别 如 下 时 ，sizeof 返 回 的 值 表示 的 含义 如 下 所 述 。 


1) 数组 一 一 编译 时 分 配 的 数组 空间 大 小 ， 如 : 





char a[10]="hello"; 








因为 char 占 1Byte， 所 以 sizeof (a) 的 值 是 10*1=10Byte。 








2) 指针 一 一 存储 该 指针 所 用 的 空间 大 小 ， 如 : 

















char *str-"I am from China." 








因为 str 存 储 的 是 一 个 字符 指针 ， 所 以 sizeof (str) 是 指针 所 占 的 空间 ， 即 是 4Byte。 


3) 类 型 一 一 该 类 型 所 占 的 空间 大 小 ， 如 : 








int b=10; 





为 在 32 位 的 机 器 上 ，int 类 型 占 4Byte， 所 以 sizeof (b) 的 值 是 4Byte。 























4) 对 象 一 一 对 象 的 实际 占用 空间 大 小 ， 如 : 





class Class Sample{ 
int a,b; 
int func(); 
JClass a; 





两 个 int 类 型 的 值 是 8Byte， 所 以 sizeof (Class a) 的 值 是 8Byte。 


5) 函数 一 一 函数 的 返回 类 型 所 占 的 空间 大 小 ， 且 函数 的 返回 类 型 不 能 是 void。 


1.4 指针 


1. 指 针 的 概念 


为 了 理解 什么 是 指针 ， 必 须 先 弄 清楚 数据 在 内 存 中 是 如 何 存储 的 ， 又 是 如 何 读 取 的 。 如 果 在 程序 中 定义 了 一 个 变量 ， 在 编译 时 就 给 这 个 变量 分 配 内 存单 元 。 系 统 根据 程序 中 定义 的 变量 类 型 ， 来 分 配 一 
定 长 度 的 空间 。 例 如 ，C++ 编 译 系统 在 32 位 机 器 上 为 整 型 变量 分 配 4Byte， 为 单 精度 浮 点 型 变量 分 配 4Byte， 为 字符 型 变量 分 配 1Byte。 内 存 区 的 每 一 个 字 节 有 一 个 编号 ， 这 个 编号 就 是 地 址 ， 如 表 1-1 所 
示 。 





表 1-1 用 户 数据 、 变 量 、 地 址 直接 的 对 应 关系 


地 址 用 户 数据 变量 名 

















表 1-1 中 展示 了 用 户 数据 、 变 量 、 地 址 直接 的 对 应 关系 。 假 设 有 变量 j， 存 的 数据 是 3， 那 它 在 内 存 中 的 地 址 就 是 2000。 











请 务必 弄 清楚 一 个 内 存单 元 的 地 址 与 内 存单 元 的 内 容 这 两 个 概念 的 区 别 。 其 实 程序 经 过 编译 以 后 已 经 将 变量 名 转换 为 变量 的 地 址 ， 对 变量 值 的 存 取 都 是 通过 地 址 进行 的 。 这 种 按 变量 地 址 存 取 变 量 值 的 
方式 称 为 直接 存 取 方 式 ， 或 直接 访问 方式 。 还 可 以 采用 另 一 种 称 为 间接 存 取 (间接 访问 ) 的 方式 ， 在 程序 中 定义 一 种 特殊 的 变量 ， 专 门 用 来 存放 地 址 。 



























































由 于 通过 地 址 能 找到 所 需 的 变量 单元 ， 因 此 可 以 说 ， 地 址 指向 该 变量 单元 。 因 此 将 地 址 形象 化 地 称 为 “指针 ” ， 一 个 变量 的 地 址 称 为 该 变量 的 指针 。 如 果 有 一 个 变量 是 专门 用 来 存放 另 一 变量 地 址 (BU 
指针 ) 的 ， 则 它 称 为 指针 变量 。 指 针 变量 的 值 〈( 即 指针 变量 中 存放 的 值 ) 是 地 址 (BE) 。 

















指针 也 是 一 种 变量 ， 普 通 的 变量 存放 的 是 实际 的 数据 ， 而 指针 3 
针 本 身 所 占 的 内 存 区 。 例 1.6 展 示 了 指针 的 使 用 。 






































指针 使 





[511.6] 举例 。 





变量 包含 的 是 内 存 中 的 一 块 地 址 ， 这 块 地 址 指向 某 个 


变量 或 者 函数 。 指 针 的 内 容 包括 : 指针 的 类 型 、 指 针 所 指向 的 类 型 、 指 针 的 值 以 及 指 





#include<iostream> 
using namespace std; 
int main(){ 





int pl=1; // pl 是 一 个 普通 的 整 型 变量 
int *p2; // P2 是 一 个 指针 ， 指 向 一 个 整 型 变量 
p2-&pl; // 把 p1 的 地 址 赋值 给 p2，P2 也 就 指向 了 P1 
cout««pl««" "««*p2««endl; // *p2 就 是 取 p2 所 指向 的 地 址 的 内 容 
pl=2; // 那么 *p2 的 值 也 是 2 
cout<<pl<<" "««*p2««endl; 
*p2-3; // 那么 p1 的 值 也 是 3 
cout««pl««" "««*p2««endl; 
return 0; 

} 

程序 的 执行 结果 是 

11 

22 

33 





例 1.6 中 定义 了 一 个 整 型 变量 p1， 
*p2 的 值 ，p1 的 值 也 会 跟着 改变 。 


2 数组 与 指针 


在 C++ 中 ， 数 组 名 代表 数组 第 一 个 元 素 的 地 址 ， 如 下 程序 定义 了 两 个 变量 : 


一 个 指向 整 型 变量 的 指针 p2， 并 将 p2 指 向 p1。 











加 个 * 号 ， 也 就 是 *p2。 修 改 了 p1 的 值 ，*p2 的 内 容 也 会 跟着 改变 ; 同样 地 ， 修 改 














p2 指 向 的 内 容 ， 必 须 在 p2 前 面 

















int *p; 
int a[10]; 





若 p=a 等 价 于 p=&a[0]， 可 以 通过 对 p、a 的 偏 移 (int 类 型 的 指针 + 1 或 -1， 
元 素 。 





(1) 数组 指针 ， 也 称 行 指针 ， 具 体内 容 如 下 所 述 。 


假设 有 定义 int (*p) [n]; E 0 优先 级 高 ， 首 先 说 明 p 是 一 个 指针 ， 且 指向 一 个 整 型 的 一 维 数组 。 这 个 一 维 数组 的 长 度 是 n， 也 可 以 说 是 p 的 步 长 ， 也 就 是 说 执行 p+1 时 ，p 要 跨 过 n 个 整 型 数据 的 长 


是 向 上 或 向 下 偏 移 sizeof (int) 个 byte) 来 访问 数组 里 的 元 素 ， 若 用 * (p+i) 、* (a+i) 也 可 以 通过 传统 的 数组 af 访问 各 个 








如 要 将 二 维 数组 赋 给 一 指针 ， 应 这 样 赋值 : 








int a[3] [4]; 

int (*p) [4]; // 该 语句 是 定义 一 个 数组 指针 ， 指 向 含 4 个 元 素 的 一 维 数组 。 
p=a; 将 该 二 维 数组 的 首 地 址 赋 给 p， 也 就 是 a[0] 或 ka[0] [0] 
ptt; // 该 语句 执行 过 后 ， 也 就 是 p=p+1;p 跨 过 行 a[0] [] 


// 所 以 数组 指针 也 称 指向 一 维 数 组 的 指针 ， 亦 称 行 指针 。 


首 向 了 行 a[1] [] 








(2) 指针 数组 不 同 于 数组 指针 ， 具 体内 容 如 下 所 述 。 


假设 有 定义 int*p[n]; 且 [ 优 先 级 高 ， 可 以 理解 为 先 与 p 结 合成 为 一 个 数组 ， 
误 的 ， 因 为 p 是 个 不 可 知 











再 由 int* 说 明 这 是 一 个 整 型 指针 数组 ， 它 有 n 个 指针 类 型 的 数组 元 素 。 这 里 若 执行 p+ 1 操作 则 是 错误 的 ，p=a 这 样 赋 值 也 是 错 


的 表示 ， 只 存在 p[0]、p[1]、p[2]http://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15788/OEBPS/Text/..….p[n-1]， 而 且 它 














只 





们 分 别 是 指针 变量 ， 





如 要 将 二 维 数组 赋 给 一 指针 数组 ， 程 序 可 以 是 : 


来 存放 变量 地 址 。 但 可 以 这 样 *p=a 赋 值 这 里 *p 表 示 指 


针 数组 第 一 个 元 素 的 值 ，a 的 首 地 址 的 值 。 





int *p[3]; 

int a[3] [4]; 

for (i=0;i<3; i++) { 
plil=a[i]; 





这 里 int*p[3] 表 示 一 个 一 维 数 组 内 存放 着 3 个 指针 变量 ， 分 别 是 p[0]、p[1]、 











这 样 数组 指针 和 指针 数组 两 者 的 





区 别 就 很 明显 了 : 数组 指针 只 是 一 个 指针 变量 ， 可 以 认为 是 C 语 


p[2]， 所 以 要 分 别 赋值 。 











向 二 维 数组 的 ， 它 占用 内 存 中 一 个 指针 的 存储 空间 ;指针 数组 是 多 个 指针 变量 ， 以 数组 














言 里 专门 用 来 指 

















需要 说 明 的 一 点 就 是 ， 同 时 








形式 存在 内 存 当 中 ， 占 用 多 个 指针 的 存储 空间 。 























比如 要 表示 数组 中 第 i 行 j 列 一 个 元 素 ， 这 几 种 方式 都 可 以 : 


* (plilej) . * C (pe) +j). C (pe ) DI. lil. 





其 中 ,优先 级 : 0 >[>*。 


3. 字 符 串 与 指针 




















到 的 操作 对 象 之 一 。 上 








BC + 中 最 经 党 











字符 




















举例 。 











【 例 1.7】 “字符 数组 、 字 符 指针 、 字 符 指针 数组 、 字 符 串 变量 应 


























数组 名 引用 都 是 一 样 的 。 





$5 











和 





来 指向 二 维 数组 时 ， 其 











E: 





字符 数组 和 字符 指针 变量 




















展示 了 字符 数组 和 字符 指针 是 如 何 使 





都 可 以 实现 字符 串 的 存储 和 运算 。 例 1.7 





#include<iostream> 
#include<string> 
using namespace std; 
int main()( 
char str[] 
char * strl-"abc" 
char * str2[]s(" "hello world","good 


- // str 是 一 个 字符 数组 


"I am a programmer." ; 


// pu PN 可 以 指向 一 个 字符 事 


// sd ipaum, 可 以 存 多 个 字符 囊 


string str3 = "I am a programmer, 
// SCRAP 变量 
cout««"str: "««Xstr««endl; 
cout««"strl: "««strl««endl; 
cout««"str2[0]: "««str2[0]««endl; 


cout««"str3: "««str3««endl; 


return 0; 





程序 的 执行 结果 是 : 





str: I am a programmer. 

strl: abc 

str2[0]: hello world 

str3: I am a programmer, too. 


例 1.7 中 ，str 是 一 个 字符 数组 ，str1 是 一 个 字符 指针 变量 ，str2 是 一 个 字符 指针 数组 ，str3 是 一 个 字符 串 变 量 。 


























(1) 字符 串 指针 变量 本 身 是 一 个 变量 ， 














于 存放 字符 串 的 首 地 址 。 可 以 改变 str1 使 它 指向 不 同 的 字符 
间 ， 它 只 是 分 配 指针 本 身 的 空间 ， 所 以 abc 会 被 当成 常量 ， 并 且 被 放 到 程序 的 常量 区 ， 不 能 被 修改 。 


(2) 字符 串 本 身 是 存放 在 以 该 首 地 址 为 首 的 一 块 连续 的 内 存 空间 中 ， 并 以 \0 作为 字符 串 的 结束 标志 。 























(3) 字符 数组 是 由 于 若干 个 数组 元 素 组 成 的 ， 每 个 元 素 中 存放 字符 串 的 一 个 字符 。 在 定义 一 个 字符 数组 时 ， 编 译 后 就 会 分 配 一 个 内 存 自 



































， 但 不 能 改变 str1 所 指 的 字符 串 常量 。 





因为 定义 指针 时 ， 编 译 器 并 不 为 指针 所 指向 的 对 象 分 配 空 





元 ， 每 个 元 素 都 有 确定 的 地 址 。 























4 .函数 与 指针 

函数 指针 是 指向 函数 的 指针 变量 。 所 以 ， 函 数 指针 首先 是 个 指针 变量 ， 而 且 这 个 变量 指向 一 个 函数 。C+ + 在 编译 时 ， 每 一 个 函数 都 有 一 个 入 口 地 址 ， 该 入 口 地 址 就 是 函数 指针 所 指向 的 地 址 。 有 了 指向 
函数 的 指针 变量 后 ， 就 可 以 用 该 指针 变量 调用 函数 了 。 

函数 指针 的 声明 方法 是 : 

返回 值 类 型 (* 指 针 变 量 名 ) ([ 形 参 列 表 ] ) ; 





其 中 ， 返 回 值 类 型 说 明 函 数 的 返回 值 类 型 ，“(?* 指 针 变量 名 ) 这 句 的 括号 不 能 省 略 。 








例如 : 





// 声明 一 个 函数 
// 声明 一 个 函数 指针 


int func(int a); 
int (*f) (int a); 
f-&func; 





将 func 函 数 的 首 地 址 赋值 给 函数 指针 ， 这 里 也 等 价 于 f=&func; 赋值 时 函数 不 带 括 号 ， 也 不 带 参数 ， 函 数 名 就 代表 了 函数 的 首 地 址 。 例 1.8 











范例 。 











【 例 1.8】 ”函数 指针 使 


#include<iostream> 

using namespace std; 

int Mmin(int x,int y)( 
if (x<y) return x; 
return y; 


Mmax (int x,int y){ 
if (x>y) return x; 
return y; 


main (){ 

int (*f) (int x,int y); 
int a-10,b-20; 

f-Mmin; // 把 Mmin 函 数 的 入 口 地 址 赋 给 下 
(*£) (a,b)<<endl; 

; // 把 Mmax 函 数 的 入 口 地 址 赋 给 f 
cout << (*f) (a,b) ««endl; 

return 0; 








展示 了 函数 指针 调 有 








函数 的 方法 。 











程序 的 执行 结果 是 : 





10 
20 


例 1.8 中 定义 了 一 个 函数 指针 f， 两 个 函数 Mmin 和 Mmax， 先 后 把 { 指 向 Mmin 和 Mmax 函 数 ， 执 行 比较 两 个 数 ， 分 别 得 出 较 小 值 和 较 大 值 。 


1.5 引用 








1. 引 





是 什么 
































对 于 习惯 使 
C++ 的 & 符 号 ， 有 利于 增强 代码 质量 和 提高 代码 执行 效率 。 























于 为 一 个 变量 起 一 个 别名 。 





5 


是 一 种 变量 类 型 ， 它 

















5 


的 声明 方法 是 : 


CC 语言 进行 开发 的 朋友 们 ， 在 看 到 C+ + 中 出 现 的 & 符 号 后 ， 可 能 会 犯 迷糊 ， 虽 然 在 C 语 言 中 这 个 符号 代表 取 地 址 符 ， 但 是 在 C+ + 中 它 却 有 着 不 一 样 的 











途 ， 代 表 着 引用 的 意思 。 掌 握 


























类 型 标识 符 & 引 用 名 = 目标 变量 名 ; 





假设 有 一 个 变量 a， 想 给 它 起 一 个 别名 r， 可 以 这 样 写 : 











































































































int a; 

int &r-a; 

定义 引用 r， 它 是 变量 a 的 引用 ， 即 别名 。 经 过 这 样 的 声明 后 ，a 和 的 作用 都 一 样 ， 都 代表 着 同一 变量 。a 和 "占用 内 存 的 同一 个 存储 单元 ， 即 具有 同一 地 址 。 在 声明 一 个 引用 变量 时 ， 必 须 同 时 使 之 初始 
化 ， 即 声明 它 代表 哪个 变量 。 函 数 执行 期 间 ， 不 可 以 将 其 再 作为 其 他 变量 的 引用 。 例 1.9 说 明了 引用 的 使 用 方法 。 




































































【 例 1.9】 引 





的 使 

















举例 。 








fincludeciostream» 
using namespace std; 
int main()( 

int a-2; 


cout««a««" "««r««endl; 
r-10; 

cout««a««" "««r««endl; 
return 0; 


} 


// 因为 a 和 的 值 会 同时 变化 ， 所 以 a 和 的 值 都 是 6。 
// 变 了 ，a 也 会 变 ， 所 以 a 和 的 值 都 是 10。 





程序 的 执行 结果 是 : 





66 
10 10 

















例 1.9 中 





展示 了 引 








2. 引 用 作为 参数 
































引用 一 个 重要 的 作用 就 是 作为 函数 的 参数 。 
【 例 1.10】 引用 作为 函数 的 参数 举例 。 























与 变量 的 关系 。r 是 a 的 引用 ，a 变 了 ，[ 的 值 也 跟着 变 ;r 变 了 ，a 的 值 也 跟着 变 。 





#include<iostream> 
using namespace std; 
void Mminl(int a,int b)( 
int temp; 
if (a>b) { 
temp=a; 
a=b; 
b=temp; 
l 


} 
void Mmin2 (int &a,int &b){ 
int temp; 
if (a>b) { 
temp=a; 
a=b; 
b=temp; 
l 
i 
int main(){ 
int a=30,b=20; 
Mmin] (a,b); 
cout<<a<<" "<<b<<endl; 
Mmin2 (a,b) ; 
cout««a««" "«xb««endl; 
return 0; 


// 引用 作 


// 
// a. bá 


为 函数 的 参数 


值 保持 不 变 。 


// a 的 值 是 20，b 的 值 是 30. a、Db 的 值 被 修改 了 





程序 的 执行 结果 是 : 





30 20 
20 30 





例 1.10 中 定义 了 两 个 求 最 小 值 的 函数 ， 其 中 M min1 是 将 一 般 变量 作为 函数 的 参数 ，Mmin2 则 


将 一 般 变 量 作为 函数 的 参数 ， 传 给 形 参 的 是 变量 的 值 ， 传 递 是 单 向 的 。 如 果 在 执行 函数 期 间 形 参 的 值 发 生变 化 ， 并 不 传 回 给 实 参 。 








使 用 引 
如 果 传递 的 是 对 象 ， 



































使 





拷贝 构造 函数 。 


指针 作为 函数 的 参数 虽然 也 能 达到 与 使 用 引 


因此 ， 当 


传递 函数 的 参数 时 ， 在 内 存 中 并 没有 产生 实 参 的 副本 ， 而 是 对 实 参 直接 操作 。 当 使 











是 将 引用 作为 函数 的 参数 。 



























































参数 传递 的 数据 较 大 时 ， 用 引 
































25; 另 一 方面 ， 在 主 调 函数 的 调 

















综 上 所 述 ， 引 





是 个 有 效率 的 选择 。 














3. 常 引 








用 


如 果 既 要 提高 程序 的 效率 ， 又 要 使 传递 给 函数 的 数据 不 在 函数 中 被 改变 ， 就 应 该 使 


点 处 ,必须 








变量 的 





同样 的 效果 ， 但 是 在 被 调 函 数 中 同样 要 给 形 参 分 配 存 储 单 元 ， 且 需要 和 








比 








一 般 变量 传递 函数 的 参数 时 ， 当 函数 发 生 调 用 ， 
一 般 变 量 传递 参数 的 效率 更 高 ， 所 占 空间 








因为 在 调 








函数 时 ， 形 参 和 实 参 不 是 同一 个 存储 单元 。 























给 形 参 分 配 存储 单元 ， 形 参 变量 是 实 参 变量 的 副本 ; 


更 少 。 




















地 址 作为 实 参 ， 这 些 都 不 太 方便 。 











的 声明 方式 是 : 





























和 E 复 使 用 “* 指 针 变量 名 ”的 形式 进行 运算 ， 这 很 容易 产生 错误 县 程序 的 阅读 性 较 





const 类 型 标识 符 & 引 用 名 = 目标 变量 名 ; 
































这 种 方式 声明 的 引 











， 不 能 通过 引 





对 目标 变 





的 值 进行 修改 ， 在 程序 中 使 引 














的 目标 成 为 const 类 型 ， 从 而 保证 了 引 











的 安全 性 ， 如 下 所 示 : 





int a; 

const int &r-a; 

r-1; // 错误 
a=1; // 正确 





假设 有 如 下 函数 声明 : 





string funcl(); 
void func2(string &s); 





那么 下 面 的 表达 式 都 是 非法 的 : 





func2 (funcl); 
func2 ("hello"); 





原因 在 于 func1 () 和 "hello "都 将 产生 一 个 临时 对 象 ， 而 在 C++ 中 ， 这 些 临 时 对 象 都 是 const 类 型 的 。 因 此 ， 上 再 











5 





型 参数 应 该 在 能 被 定义 成 const 的 情况 下 ， 尽 量 定义 为 const。 














的 表达 式 就 是 试图 将 一 个 const 类 型 的 对 象 转化 为 非 const 类 型 ， 这 是 非法 的 。 








1.6 ”结构 体 、 公 用 体 、 枚 举 


1.6.1 “结构 体 、 共 用 体 、 枚 举 的 概念 


1. 结 构 体 的 声明 方法 


结构 体 的 声明 方法 如 下 所 示 : 





struct 结构 名 { 
数据 类 型 成 员 名 ; 
数据 类 型 成 员 名 7 


http: //www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/... 


H 





成 员 表 由 若干 成 员 组 成 ， 每 个 成 员 都 是 该 结构 的 一 个 组 成 部 分 ， 








【 例 1.11】 ”结构 体 使 用 范例 。 




















对 每 个 成 员 也 必须 做 类 型 声明 。 例 1.11 说 明了 结构 体 的 使 用 方法 。 

















#include<iostream> 
#include<string.h> 
using namespace std; 


struct student{ // 声明 一 个 结构 体 类 型 student 
int num; 
char name[20]; 
int age; 

E // 最 后 有 一 个 分 号 

int main(){ 
struct student stul; // 定义 一 个 student 类 型 的 变量 stul 
student stu2; // 定义 时 也 可 以 不 用 struct 
stul.num=1; // 单独 对 st1 的 num 元 素 赋值 


char temp [20]="Xiao ming"; 

strncpy (stul.name, temp, strlen (temp)); 

stul.age-10; 

cout««stul.num««" "««stul.name««" "««stul.age««endl; 





student *stu3-sstul; // stu3 是 结构 体 的 指针 ， 指 向 stul 
(*stu3) .num-2; // stul 的 num 值 被 修改 成 了 2; 
cout««stul.num««" "<<stul.name<<" "««stul.age««endl; 
return 0; 

} 

程序 的 执行 结果 是 : 





1 Xiao ming 10 
2 Xiao ming 10 





例 1.11 中 声明 了 一 个 结构 体 类 型 student， 定 义 了 两 个 student 类 型 的 变量 stu1 和 stu2， 分 别 用 











struct 关 键 字 的 使 用 更 为 方便 。 














引用 结构 体 变量 中 成 员 的 一 般 方 式 为 : 











了 两 种 定义 方法 ， 


分 别 是 前 面 有 struct 关 键 字 和 没有 struct 关 键 字 。 这 两 种 定义 方法 都 是 可 以 的 ， 显 然 没 





结构 体 变 量 名 .成 员 名 





例 1.11 中 ，stu1.num 表 示 结 构 体 变量 stu1 中 的 成 员 数 量 的 值 。 








指针 也 可 以 应 用 于 结构 体 ， 例 1.11 中 stu3 就 是 一 个 结构 体 变量 ， 








2. 共 用 体 














指向 stu1。 


共用 体 ， 用 关键 字 union 来 定义 ， 它 是 一 种 特殊 的 类 。 在 一 个 共用 体 里 可 以 定义 多 种 不 同 的 数 








目的 。 但 同一 时 间 只 能 储存 其 中 一 个 成 员 变量 的 值 。 














共用 体 的 声明 方式 为 : 





居 类 型 ， 这 些 数 H 





RRE 


AXES 


RAF, EPERERA 





居 类 型 和 长 度 的 变量 ， 以 达到 节省 空间 的 

















union 共用 体 类 型 名 { 
数据 类 型 成 员 名 ; 
数据 类 型 X5: 


http: //www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/... 


} 变量 名 ; 











可 以 使 用 union 判 断 系统 是 big endian (Xi) 还 是 little endian (小 端 ) 。 








【 例 1.12】 ”判断 系统 是 big endian 还 是 little endian, 





fincludeciostream» 
using namespace std; 
union TEST( 

short a; 

char b[sizeof (short)]; 
Hu 
int main()( 

TEST test; 


test.a-0x0102;// 不 能 引用 共用 体 变 量 ， 只 能 引用 共用 体 变 量 中 的 成 员 。 
{ 


if(test.b[0]--0x01&&test.b[1]--0x02) 
cout««"big endian."««endl; 

l 

else if(test.b[0]--0x02&&test.b[1]--0x01) ( 
cout««"small endian."««endl; 

l 

else( 
cout««"unknown"««endl; 

} 


return 0; 





程序 的 执行 结果 是 : 





small endian. 








Hh, big endian 是 指 低地 址 存放 最 高 有 效 字 节 ，little endian 则 是 低地 址 存放 最 低 有 效 字 节 。 如 果 将 0x1234abcd 写 入 0x0000 开 始 的 内 存 中 ， 则 结果 如 表 1-2 所 示 。 


表 1-2 bigendian 和 little endian 的 内 存 地 址 增长 方向 








表 1-2 展 示 了 0x1234abcd 分 别 在 big endian 的 系统 和 在 little endian 的 系统 上 的 内 存 地 址 是 怎么 样 分 布 的 。 例 如 0x0000 是 1Byte 的 存储 单元 ，0x12 单 元 一 共 占 了 8bit， 也 就 是 1byte， 即 占用 了 1Byte。 























目前 ， 几 乎 所 有 网 络 协议 都 是 采用 big endian 的 方式 来 传输 数据 的 ， 当 两 台 采 用 不 同 字 节 序 的 主机 通信 时 ， 在 发 送 数据 之 前 都 必须 经 过 字 节 序 的 转换 成 为 网 络 字 节 序 (big endian) 后 再 进行 传播 。 














3. 枚 举 


在 实际 问题 中 ， 有 些 变量 的 取 值 被 限定 在 一 个 有 限 的 范围 内 。 例 如 ， 一 个 星期 只 有 7 天 ， 一 年 只 有 12 个 月 ， 一 个 班 每 周 有 6 门 课程 等 。 如 果 把 这 些 量 说 明 为 整 型 ， 字 符 型 或 其 他 类 型 显然 是 不 妥当 的 。 为 
此 ，C 语 言 提供 了 一 种 称 为 “ 枚 举 ” 的 类 型 ， 枚 举 类 型 在 C++ 中 也 同样 适用 。 在 “ 枚 举 ” 类 型 的 定义 中 列举 出 所 有 可 能 的 取 值 ， 用 来 说 明 该 “ 枚 举 ” 类 型 的 变量 取 值 不 能 超过 定义 的 范围 。 应 该 说 明 的 是 ， 
枚 举 类 型 是 一 种 基本 数据 类 型 ， 而 不 是 一 种 构造 类 型 ， 因 为 它 不 能 再 分 解 为 任何 其 他 基本 类 型 。 

















枚 举 的 声明 方式 为 : 





enum 枚 举 类 型 名 { 枚 举 常量 表 列 }; 























如 同 结构 和 共用 体 一 样 ， 枚 举 变量 也 可 用 不 同 的 方式 说 明 ， 即 先 定义 后 说 明 ， 同 时 定义 说 明 或 直接 说 明 。 














设 有 变量 a，b，< 是 枚 举 类 型 weekday， 可 采用 下 述 任 一 种 方式 : 





enum weekday( sun,mou, tue, wed, thu,fri,sat }; 
enum weekday a,b,c; 





或 者 为 : 





enum weekday( sun,mou,tue,wed,thu,fri,sat ja,b,c; 











enum ( sun,mou,tue,wed,thu,fri,sat Ja,b,c; 











枚 举 值 是 常量 ， 不 是 变量 。 不 能 在 程序 中 用 赋值 语句 再 对 它 赋值 。 











例如 对 枚 举 weekday 的 元 素 再 作 以 下 赋值 ， 都 是 错误 的 : 





sun-5; 
mon-2; 
sun-mon; 





只 能 把 枚 举 值 赋予 枚 举 变 量 ， 不 能 把 元 素 的 数值 直接 赋予 枚 举 变量 ， 如 下 面 的 语句 是 正确 的 : 

















a-sum; 

b=mon; 

而 下 面 的 语句 则 是 错误 的 : 
a-0; 

b-1; 

















如 一 定 要 把 数值 赋予 枚 举 变量 ， 则 必须 用 强制 类 型 转换 ， 如 : 











a= (enum weekday)2; 








其 意义 是 将 顺序 号 为 2 的 枚 举 元 素 赋予 枚 举 变量 a， 相 当 于 : 





a-tue; 





























还 应 该 说 明 的 是 枚 举 元 素 不 是 字符 常量 也 不 是 字符 串 常量 ， 使 用 时 不 要 加 单 、 双 引号 。 


























【 例 1.13】 enum 使 用 范例 。 





#include<iostream> 
using namespace std; 
int main (){ 
enum weather{sunny, cloudy, rainy, windy); 
/* XP sunny-0, cloudy-1, rainy-2, windy-3, 
默认 地 ， 第 一 个 枚 举 子 被 赋值 为 0*/ 
enum fruits{apple=3,orange,banana=7, bear}; 
/* 也 可 以 显 式 地 赋值 ， 接 下 来 的 枚 举 子 取 值 是 前 面 一 个 枚 举 子 的 取 值 +1， 即 orange=4，bear=8*/ 
cout««orange««endl; 


enum big _ cities{guangzhou=1, shenzhen=3, eijing=1, shanghai-2); 
/x* 同 一 枚 涛 中 的 枚 举 子 的 取 值 不 需要 是 唯一 的 */ 


return 0; 





程序 的 执行 结果 是 : 























例 1.13 中 定义 了 3 个 枚 举 类 型 : weather、fruits 和 big_cities， 其 中 weather 中 的 枚 举 子 都 被 显 式 地 赋值 了 ，fruits 中 的 枚 举 子 只 赋值 了 其 中 几 个 ， 没 显 式 赋值 的 则 是 前 面 一 个 枚 举 子 的 取 值 +1。 同 一 枚 
举 类 型 中 的 枚 举 子 的 取 值 不 需要 是 唯一 的 ， 可 以 相同 。 











1.7” 预 处 理 























C++ 提供 的 预 处 理 功能 主要 有 以 下 4 种 : 宏 定义 、 文 件 包含 、 条 件 编译 和 布局 控制 。 文 件 包含 在 前 面 已 描述 过 ， 下 面 重点 描述 宏 定义 、 条 件 编译 和 布局 控制 ， 其 中 又 着 重 讲述 常用 宏 定 义 命令 、do.……. 
while (0) 的 妙用 、 条 件 编译 及 extern"C" 块 的 应 用 知识 。 












































1. 常 用 宏 定义 命令 


























#define 命 令 是 一 个 宏 定义 命令 ， 它 用 来 将 一 个 标识 符 定义 为 一 个 字符 串 ， 该 标识 符 被 称 为 宏 名 ， 被 定义 的 字符 串 称 为 替换 文本 。 该 命令 有 两 种 格式 : 一 种 是 简单 的 宏 定义 ， 另 一 种 是 带 参数 的 宏 定 义 。 








简单 的 宏 定义 的 声明 格式 如 下 所 示 : 





#define 宏 名 字符 串 





例 : #define PI 3.1415926 


带 参数 的 宏 定义 的 声明 格式 如 下 所 示 : 





例 : #define A (x) x 














使 用 宏 定 义 中 ， 要 注意 以 下 问题 。 
































(1) 在 简单 宏 定义 的 使 用 中 ， 当 替换 文本 所 表示 的 字符 串 是 一 个 表达 式 时 ， 需 要 加 上 括号 ， 否 则 容易 引起 误解 和 误 用 。 


























【 例 1.17】 ”简单 宏 定义 不 加 括号 容易 引起 误 用 。 








#include<iostream> 
#define N 2+9 
using namespace std; 
int main(){ 
int a=N*N; 
cout««a««endl; 
return 0; 





程序 的 执行 结果 是 : 
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例 1.17 中 就 出 现 了 问题 : 在 此 程序 中 存在 着 宏 定 义 命令 ， 宏 N 代 表 的 字符 串 是 2+9， 在 程序 中 有 对 宏 N 的 使 用 ， 一 般 同 学 在 读 该 程序 时 ， 容 易 产 生 的 问题 是 先 求解 N 为 2+9=11， 然 后 在 程序 中 计算 a 时 使 
乘法 ， 即 N*N=11*11=121， 其 实 该 题 的 结果 为 29， 为 什么 结果 有 这 么 大 的 偏差 因为 宏 展开 是 在 预 处 理 阶段 完成 的 ， 这 个 阶段 把 替换 文本 只 是 看 作 一 个 字符 串 ， 并 不 会 有 任何 的 计算 发 生 ， 在 展开 时 是 在 
宏 N 出 现 的 地 方 只 是 简单 地 使 用 串 2+ 9 来 代替 N， 并 不 会 增添 任何 的 符号 ， 所 以 对 该 程序 展开 后 的 结果 是 a=2+9*2+9， 计 算 后 结果 为 29。 要 程序 如 之 前 想 要 的 结果 ， 只 需要 写成 #define N (2+9) ， 即 加 
上 括号 就 行 。 














































































































(2) 类 似 地 ， 在 带 参数 的 宏 定义 的 使 用 中 ， 也 容易 引起 误解 。 例 如 当 需 要 使 用 宏 蔡 换 来 求 任何 数 的 平方 ， 这 时 就 需要 使 用 参数 ， 以 便 在 程序 中 用 实际 参数 来 蔡 换 宏 定义 中 的 参数 。 初 学 者 容易 写成 如 例 
1.18 中 的 形式 。 



























































[511.18] — 带 参数 的 宏 定义 不 加 括号 容易 引起 误 用 。 





fincludeciostream» 
using namespace std; 
#define area(x) x*x 
int main() 
{ 
int y = area (2+2); 
cout<<y<<endl; 
return 0; 


} 





程序 的 执行 结果 是 : 

















表面 上 看 ， 给 的 参数 是 2+2， 所 得 的 结果 应 该 为 4+44=16， 但 该 程序 的 实际 结果 为 8。 宏 定义 中 要 遵循 先 蔡 换 后 计算 的 原则 ， 在 上 面 的 程序 里 ，2+2 即 为 宏 area 中 的 参数 ， 应 该 由 它 来 替换 宏 定义 中 的 x， 
即 蔡 换 成 2+2*2+2=8 了 。 那 如 果 遵 循 (1) 中 的 解决 办 法 ， 把 2+2 括 起 来 ， 即 把 宏 体 中 的 x 括 起 来 ， 是 否 可 以 解决 呢 ? #define area (x) (x) * (x) ， 对 于 area (2+2) , #3 (2+2) * (2+2) -16, 
可 以 解决 ， 但 是 对 于 area (2+2) /area (2+2) 又 会 怎么 样 呢 ， 有 人 一 看 到 这 道 题 马上 给 出 结果 1， 因 为 分 子 分 母 一 样 ， 那 么 这 样 就 又 错 了 。 遵 循 先 蔡 换 再 计算 的 规则 ， 这 道 题 蔡 换 后 会 变 为 

(2+2) * (2+2) / (2+2) * (2+2) 即 4*4/4:4 按 照 乘除 运算 规则 ， 结 果 为 16/4*4=4*4=16。 解 决 这 类 问题 的 方法 是 在 整个 宏 体 上 再 加 一 个 括号 ， 即 #define area (x) ( (x) * 69 ) ， 不 要 觉得 这 没 必 
要 ， 没 有 它 是 不 行 的 。 





















































要 想 能 够 真正 使 用 好 宏 定 义 ， 在 读 别 人 的 程序 时 ， 一 定 要 记 住 先 将 程序 中 对 宏 的 使 用 全 部 蔡 换 成 它 所 代表 的 字符 串 ， 不 要 自作 主张 地 添加 任何 其 他 符号 ， 完 全 展开 后 再 进行 相应 的 计算 ， 就 不 会 求 错 运 


行 结果 。 























如 果 是 自己 在 编程 时 使 用 宏 蔡 换 ， 则 在 使 用 简单 宏 定义 时 ， 当 字符 串 中 不 只 一 个 符号 时 ， 加 上 括号 表现 出 优先 级 ， 如 果 是 带 参数 的 宏 定义 ， 则 要 给 宏 体 中 的 每 个 参数 加 上 括号 ， 并 在 整个 宏 体 上 再 加 一 


个 括号 。 


























2.dohttp://www.hzcourse.com/resource/readBook?path z/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...while (0) 的 妙用 























大 家 都 知道 ，do{…jwhile (condition) 可 以 表示 循环 ， 但 你 有 没有 遇 到 在 一 些 宏 定义 中 可 以 不 用 循环 的 地 方 ， 也 用 到 了 do{…}while， 比 如 有 这 样 的 宏 : 








#define Foo(x) do{\ 
statement one; \ 
statement two; V 
)while(0) // 这 里 没有 分 号 


粗 看 会 觉得 很 奇怪 ， 既 然 循 环 里 面 只 执行 了 一 次 ， 那 要 这 个 看 似 多 余 的 dohttp://www.hzcourse.cory/resource/readBook? 
path=/openresources/teach_ebook/uncompressed/15788/0EBPS/Text/...while (0) 有 什么 意义 呢 ? 再 来 看 这 样 的 宏 : 








#define Foo(x) (V 
statement one;V 
statement two; V 


} 



































这 两 个 看 似 一 样 的 宏 ， 其 实 是 不 一 样 的 。 前 者 定义 的 宏 是 一 个 非 复合 语句 ， 而 后 者 却 是 一 个 复合 语句 。 假 如 有 这 样 的 使 用 场景 : 


if (conditon) 
Foo(x); 


se 
http: //www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...; 





因为 宏 在 预 处 理 的 时 候 会 直接 被 展开 ， 采 用 第 2 种 写法 ， 会 变 成 : 





























if (condition) 
statement one; 
Statement two; 


se 
http: //www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/.../// 





这 样 会 导致 else 语 句 孤 立 而 出 现 编译 错误 。 加 了 dof{http://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15788/OEBPS/Text/..}while (0) ， 就 
使 得 宏 展开 后 ， 仍 然 保留 初始 的 语义 ， 从 而 保证 程序 的 正确 性 。 


3. 条 件 编译 




















股 情况 下 ， 源 程序 中 所 有 行 的 语句 都 参加 编译 。 但 是 有 时 程序 员 希 望 其 中 一 部 分 内 容 只 在 满足 一 定 条 件 时 才 进 行 编译 ， 也 就 是 对 一 部 分 内 容 指定 编译 的 条 件 ， 这 就 用 到 了 “条件 编 译 ”。 


条 件 编译 命令 最 常见 的 形式 为 : 





fendif 




















中 #else 部 分 也 可 以 没有 ， 即 : 





它 的 作用 是 : 当 标 识 符 已 经 被 定义 过 (一 般 是 用 #define 命 令 定义 ) ， 则 对 程序 段 1 进行 编译 ， 否 则 编译 程序 段 2。 

















#ifdef 标识 符 
程序 段 1 
#endif 








下 面 这 样 的 形式 则 是 当 指定 的 表达 式 值 为 真 ( 非 零 ) 时 就 编译 程序 段 1， 否 则 编译 程序 段 2。 可 以 事先 给 定 一 定 条 件 ， 使 程序 在 不 同 的 条 件 下 执行 不 同 的 功能 。 





Hf 表达 式 
程序 段 1 

#else 
程序 段 2 

#endif 





这 里 的 “程序 段 ” 可 以 是 语句 组 ， 也 可 以 是 命令 行 。 


有 时 候 程序 中 的 某 些 调试 代码 ， 只 需要 在 调试 的 时 候 被 编译 ， 而 不 希望 在 程序 的 正式 发 行 版 中 被 编译 ， 你 可 能 会 看 到 类 似 例 1.19 这 样 的 代码 段 。 








【 例 1.19】 ”调试 代码 巧 用 条 件 编译 。 

















#include<iostream> 
using namespace std; 
#define  DEBUG 
int máin()( ^ 
int x-10; 
#ifdef  DEBUG 
cout««"File:"«« FILE ««",Line:"«« LINE ««",x:"««x««endl; 
felse PE ad Dd m 
printf ("x = $dWMn", x); 
cout««x««endl; 
fendif 
return 0; 





程序 的 运行 结果 是 : 





File:test.cpp,Line:7,x:10 





34 DEBUG 没有 被 定义 的 时 候 ， 仅 编译 #else 与 #endif 之 间 的 代码 ; 当 定 义 了 _DEBUG 符号 之 后 ， 则 会 编译 #ifdef 与 #else 之 间 的 代码 。 要 想 定 义 一 个 符号 很 简单 ， 只 需要 在 文件 头 部 加 上 像 这 样 的 一 条 
语句 : 





$define _DEBUG 



























































#define 命 令 的 目的 不 在 于 用 _DEBUG 代表 一 个 字符 串 ， 而 只 是 表示 已 定义 过 DEBUG_， 因 此 _DEBUG 后 面 写 什么 字符 串 都 无 所 谓 ， 甚 至 可 以 不 写字 符 串 。 


4.extern"C" 块 的 应 用 





经 常 能 在 C 与 C++ 混 编 的 程序 中 看 到 这 样 的 语句 : 





#ifdef _ cplusplus 

extern "C" { 
#endif 

http: //www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/... 
#ifdef _ cplusplus 


#endif 








其 中 ，_cplusplus 是 C++ 的 预定 义 宏 ， 表 示 当 前 开发 环境 是 C+ +, ECHES, 797 xcSEB SUD VB), ERRERA, SURAET BERRAR) ， 如 加 入 函 
数 的 参数 类 型 或 返回 类 型 等 ， 而 在 C 语 言 中 ， 只 是 简单 的 函数 名 字 而 已 ， 并 不 加 入 其 他 信息 ， 如 下 所 示 : 














int func (int demo); 
int func(double demo); 


C 语 言 无 法 区 分 上 面 两 个 函数 的 不 同 ， 因 为 C 编 译 器 产生 的 函数 名 都 是 func， 而 C++ 编译 器 产生 的 名 字 则 可 能 是 func_Fi 和 _func_Fd， 这 样 就 很 好 地 把 函数 区 别 开 了 。 





























所 以 ,在 C/C++ 混合 编程 的 环境 下 ，extern"C" 块 的 作用 就 是 告诉 C++ 编 译 器 这 段 代码 要 按 C 标 准 编译 ， 以 尽 可 能 地 保持 C++ 与 C 的 兼容 性 。 例 1.20 说 明了 _cplusplus 的 使 用 方法 。 














【 例 1.20】 ”_cplusplus 的 使 用 方法 。 








#include<stdio.h> 
int main() { 
#define TO LITERAL(text) TO LITERAL (text) 
#define TO LITERAL (text) #text ` 
#ifndef _ cplusplus 
/* this translation unit is being treated as a C one */ 
printf("a C programWn"); 
#else 
/*this translation unit is being treated as a C++ one*/ 
printf ("a C++ program\n cplusplus expands to \"" 
TO_LITERAL ( cplusplus) WN 
#endif 
return 0; 





程序 的 执行 结果 是 : 





a C++ program 
. Ccplusplus expands to "1" 





例 1.20 中 程序 的 意思 是 : 如 果 没 有 定义 _cplusplus， 那 么 当前 源 代码 就 会 被 当 作 C 源 代码 处 理 ; 如 果 定 义 了 _cplusplus， 那 么 当前 源 代 码 会 被 当中 C++ 源 代码 处 理 ， 并 且 输 出 _cplusplus 宏 被 展开 后 的 
字符 串 。 





18 ”本 章 小 结 


本 章 抛砖引玉 地 讲述 了 C++ 中 的 常用 技术 ， 通 过 简单 的 例子 ， 读 者 可 轻易 学 会 其 使 用 方法 。 读 者 在 实际 编程 时 ， 简 单 的 知识 点 直接 查阅 本 章 即 可 。 


学 习 C++， 既 要 会 利用 C++ 进行 面向 过 程 的 结构 化 程序 设计 ， 也 要 会 利用 C++ 进行 面向 对 象 的 程序 设计 。 接 下 来 的 第 2 章 ， 我 们 将 学 习 面向 对 象 的 C++。 


第 2 章 面向 对 象 的 C++ 


学 习 C++， 一 定 要 学 会 面向 对 象 编 程 。 首 先 讲 下 “面向 对 象 ”产生 的 历史 原因 ， 主 要 有 以 下 两 点 。 


(1) 计算 机 只 会 按照 人 所 写 的 代码 ， 一 步 一 步 地 执行 下 去 ， 最 终 得 到 结果 。 无 论 程序 多 么 复杂 ， 计 算 机 总 是 能 轻松 应 付 。 结 构 化 编程 ， 就 是 按照 计算 机 的 思维 写 出 的 代码 ， 但 是 人 看 到 这 么 复杂 的 逻 
辑 ， 无 法 进行 维护 和 扩展 。 


(2) 结构 化 设计 是 以 功能 为 目标 来 构造 应 用 系统 ， 这 种 做 法 导致 程序 员 设 计 程 序 时 ， 不 得 不 将 客体 所 构成 的 现实 世界 映射 到 由 功能 模块 组 成 的 解 空间 中 ， 这 种 转换 过 程 ， 背 离 了 人 们 观察 和 解决 问题 的 


可 见 ， 结 构 化 设计 在 构造 系统 的 时 候 ， 无 法 解决 重用 、 维 护 、 扩 展 的 问题 ， 而 且 会 导致 遇 辑 过 于 复杂 ， 代 码 上 涩 难 懂 。 于 是 人 们 就 想 ， 能 不 能 让 计算 机 直接 模拟 现实 的 环境 ， 用 人 类 解决 问题 的 思路 、 
习惯 、 步 骤 来 设计 相应 的 应 用 程序 ? 这 样 的 程序 ， 人 们 在 读 它 的 时 候 ， 会 更 容易 理解 ， 也 不 需要 再 把 现实 世界 和 程序 世界 之 间 来 回 做 转换 。 于 是 面向 对 象 的 编程 思想 就 产生 了 。 


本 章 主要 从 面向 对 象 的 封装 、 继 承 和 多 态 三 大 特征 来 带 读者 进入 面向 对 象 的 C++ 世界 。 


21 类 与 对 象 


1. 类 与 对 象 的 概念 





面向 对 象 编程 的 主要 思想 是 把 构成 问题 的 各 个 事务 分 解 成 各 个 对 象 ， 建 立 对 象 的 目的 不 是 为 了 完成 一 个 步骤 ， 而 是 为 了 描述 一 个 事物 在 解决 问题 中 经 过 的 步骤 和 行为 。 对 象 作为 程序 的 基本 单元 ， 将 程 






































序 和 数据 封装 其 中 ， 以 提高 软件 的 重用 性 、 灵 活性 和 扩展 性 。 类 ， 是 创建 对 象 的 模板 ， 一 个 类 可 以 创建 多 个 相同 的 对 象 ， 对象， 是 类 的 实例 ， 是 按照 类 的 规则 创建 的 。 类 与 对 象 的 关系 如 图 2-1 所 示 。 
bE m 一 gm 
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图 2-1 中 ， 人 和 学 生 属 于 类 ， 张 三 和 学 生 李 四 都 是 对 象 ， 姓 名 、 身 高 、 地 址 、 年 龄 、 性 别 、 血 型 都 是 人 这 一 类 的 属性 ， 跑 步 、 吃 饭 ， 这 都 是 人 这 个 类 的 方法 。 属 性 是 一 个 变量 ， 用 来 表示 一 个 对 象 的 特 
征 ; 方法 是 一 个 函数 ， 用 来 表示 对 象 的 操作 。 对 象 的 属性 和 方法 统称 为 对 象 的 成 员 。 


图 2-1 类 与 对 象 的 关系 
























































每 一 个 实体 都 是 对 象 ， 有 一 些 对 象 是 具有 相同 的 结构 和 特性 的 。 每 个 对 象 都 属于 一 个 特定 的 类 型 ， 这 个 特定 的 类 型 称 为 类 。 正 如 结构 体 类 型 和 结构 体 变量 一 样 ， 需 要 先 声明 一 个 结构 体 类 型 ， 再 用 它 去 
结构 体 变量 。 在 C+ + 中 也 是 先 声明 一 个 类 的 类 型 ， 然 后 用 它 去 定义 若干 个 同类 型 的 对 象 。 可 以 说 ， 对 象 是 类 类 型 的 一 个 变量 ， 类 则 是 对 象 的 模板 。 类 是 抽象 的 ， 不 占用 存储 空间 的 ; 而 对 象 是 具体 的 ， 
占用 存储 空间 。 


























类 类 型 的 声明 形式 如 下 : 





class 类 名 { // class, 声明 一 个 类 必须 有 的 关键 字 
privat 


A 83 3E o LE A; 


lic 
公用 的 数据 和 成 员 函 部 ; 
H // 类 的 声明 以 分 号 结束 








其 中 ，private 和 public 称 为 成 员 访问 限定 符 。 





下 面 再 来 看 下 结构 体 和 类 的 不 同 之 处 。 例 2.1 展 示 了 在 C++ 中 声明 一 个 结构 体 类 型 的 方法 ; 例 2.2 则 是 声明 一 个 类 的 方法 。 


【 例 2.1】 ”声明 一 个 结构 体 类 型 。 





struct SStudent( 
int num; 
char name[20]; 
int age; 

H 


SStudent st stul,st stu2; // 定义 了 两 个 结构 体 变 量 





【 例 2.2】 ”声明 一 个 类 。 





class CStudent{ 


int num; 

char name[20]; 

int age; // 这 些 是 数据 成 员 ， 也 称 为 成 员 变量 
void display(){ // 这 是 成 员 函 数 


cout««"num: "««num««end] ; 
cout««"name: "««name««endl ; 
cout««"age:"««age««endl ; 


} 


H 
CStudent cstul,cstu2; // 定义 了 两 个 对 象 





例 2.1 中 声明 了 一 个 SStudent 结 构 体 ， 结 构 体 内 有 三 个 数据 成 员 : num、name[20] 和 age; 还 定义 了 两 个 SStudent 结 构 体 类 型 的 变量 st_stu1 和 st_stu1。 例 2.2 中 声明 了 一 个 CStudent 类 ， 类 中 有 三 个 
数据 成 员 和 一 个 成 员 函 数 display， 还 定义 了 两 个 对 象 cstu1 和 cstu2。 




















从 上 面 结构 体 的 声明 方法 和 类 的 声明 方法 来 看 ， 狐 似 只 有 关键 字 不 一 样 ， 结 构 体 的 关键 字 是 struct， 类 的 关键 字 是 class。 事 实 上 ， 声 明 类 的 方法 是 由 声明 结构 体 类 型 的 方法 发 展 而 来 的 。 但 是 ，struct 中 
的 成 员 访问 权限 默认 是 public， 而 class 中 则 默认 是 private 的 。 在 C 语 言 里 ，struct 中 不 能 定义 成 员 函 数 ， 而 在 C++ 中 ， 增 加 了 class 类 型 后 ， 扩 展 了 struct 的 功能 ，struct 中 也 能 定义 成 员 函 数 了 。 

















【 例 2.3】 ”struct 中 定义 成 员 函 数 。 





struct SStudent( 


public: 
void display O t // 这 是 成 员 函 数 
Cout<<"num: "««num««endl; 
cout««"name: "««name««endl1; 
cout««"age: "««age««endl ; 
l // 这 里 没有 分 号 
private: 
int num; 
char name[20]; 
int age; 


H 





例 2.3 中 在 结构 体 Sstudent 中 定义 了 一 个 display 的 public 的 成 员 函 数 ，3 个 private 的 成 员 变 量 。 请 注意 ， 一 个 成 员 函 数 如 果 在 类 中 定义 ， 在 定义 结束 的 } 之 后 是 不 需要 加 分 号 的 。 


在 一 个 类 中 ， 关 键 字 private 和 public 可 以 分 别 出 现 多 次 ， 从 每 个 部 分 的 有 效 范围 到 出 现 另 一 个 访问 限定 符 或 者 类 体 结束 为 止 。 为 了 使 程序 清晰 ， 建 议 大 家 养 成 良好 的 习惯 ， 使 每 一 种 成 员 访问 限定 符 在 
类 体 中 只 出 现 一 次 ， 并 且 先 写 public 部 分 ， 把 private 部 分 放 在 类 体 的 后 部 ， 这 样 可 以 使 得 用 户 将 注意 力 集中 在 能 被 外 界 调用 的 成 员 上 ， 使 得 阅读 者 的 思路 更 加 清晰 。 
































一 个 对 象 的 声明 方式 有 以 下 几 种 。 

(1) dass 类 名 对 象 名 。 

(2) 类 名 ”对 象 名 。 

这 两 种 方法 是 等 效 的 ， 但 显然 第 二 种 方法 更 为 简洁 与 方便 。 


2. 成 员 函 数 














类 的 成 员 函 数 是 函数 的 一 种 ， 与 第 1 章 介绍 过 的 函数 一 样 ， 具 有 返回 值 和 函数 类 型 ， 它 与 一 般 函 数 的 区 别 在 于 ， 它 是 属于 类 的 成 员 ， 出 现在 类 体 中 。 它 可 以 被 指定 为 private (私有 的 ) 、protected ( 受 
保护 的 ) 和 public (公用 的 ) 。 


















































在 使 用 成 员 函 数 时 ， 要 注意 它 的 权限 以 及 作用 域 。 比 如 ， 私 有 的 成 员 函 数 只 能 被 本 类 中 其 他 成 员 函 数 使 用 ， 而 不 能 在 类 外 被 调用 。 成 员 函 数 中 可 以 使 用 类 中 的 任何 成 员 ， 包 括 私有 的 和 公用 的 。 



































成 员 函 数 可 以 在 类 体 中 定义 ， 也 可 以 在 类 外 定义 。 


【 例 2.4】 成员 函数 在 类 外 被 定义 。 





class CStudent ( 
public: 

void display(; // 这 里 需要 分 号 
private: 

int num; 

char name[20]; 

int age; 


HN 

void CStudent::display()( 
cout««"num: "««num««endl1; 
cout««"name: "««name««endl ; 
cout««"age: "««age««endl ; 

} 


















































例 2.4 中 在 类 CStudent 外 定义 了 display 成 员 函 数 。 注 意 ， 在 类 外 定义 成 员 函 数 时 ， 必 须 加 上 类 名 ， 予 以 限定 。“: : ”是 作用 域 限定 符 或 作用 域 运算 符 ， 用 它 声明 函数 是 属于 哪个 类 的 。 如 果 没 有 写 类 
名 或 者 没有 写 类 名 和 作用 域 限定 符 ， 则 这 个 函数 不 属于 任何 类 ， 而 是 一 个 普通 函数 。 成 员 函 数 必须 先 在 类 中 声明 ， 然 后 再 在 类 外 定义 ， 即 类 体 的 位 置 应 在 函数 定义 之 前 ， 否 则 编译 时 会 出 错 。 























3. 类 的 封装 性 






































C++ 中 通过 类 实现 封装 性 ， 把 数据 和 这 些 数据 有 关 的 操作 封装 在 一 个 类 里 。 但 是 ， 人 们 在 使 用 时 ， 往 往 不 关心 类 中 的 具体 实现 











而 只 需 知道 调用 哪个 函数 会 得 到 什么 结果 ， 能 实现 什么 功能 即 可 。 
































为 了 实现 类 对 象 的 封装 性 (数据 隐藏 和 提供 访问 接口 ) ， 类 类 型 定义 为 类 成 员 提供 了 私有 、 公 有 和 受 保护 的 3 种 基本 访问 权限 供用 户 选 择 ， 具 体内 容 如 下 所 述 。 











(1) 私有 成 员 
1) 访问 权限 : 只 限于 类 成 员 访问 。 
2) 关键 字 : private。 
3) 私有 段 : 从 private 关 键 字 开始 至 其 他 访问 权限 声明 之 间 所 有 成 员 组 成 的 代码 段 。 
4) 成 员 种 类 : 数据 成 员 和 成 员 函 数 。 


(2) 公有 成 员 


1) 访问 权限 : 允许 类 成 员 和 类 外 的 任何 访问 。 


2) 关键 字 : public。 














3) MAR: 从 public 关 键 词 开始 至 其 他 访问 权限 声明 之 间 所 有 成 员 组 成 的 代码 段 。 





4) 成 员 种 类 : 数据 成 员 和 成 员 函 数 。 


(3) 受 保护 成 员 


A 


访问 权限 : 允许 类 成 员 和 派生 类 成 员 访问 ， 不 运行 类 外 的 任何 访问 。 


2) 关键 字 : protect。 








3) MAR: 从 protect 关 键 词 开始 至 其 他 访问 权限 声明 之 间 所 有 成 员 组 成 的 代码 段 。 





4) 成 员 种 类 : 数据 成 员 和 成 员 函 数 。 








除了 限制 访问 权限 ， 在 写 代码 时 经 常 要 注意 “将 接口 与 实现 分 离 ”， 这 也 是 隐蔽 信息 的 一 个 重要 手段 。 接 口 与 实现 分 离 ， 有 以 下 两 个 好 处 : @ 如 果 想 修改 或 者 扩充 类 的 功能 ， 只 需要 修改 类 中 的 实现 ， 
类 外 部 分 可 以 不 用 修改 ;@ 如 果 发 现 类 中 数据 成 员 数据 有 错 ， 则 只 需要 在 类 内 检查 访问 这 些 数据 成 员 的 成 员 函 数 。 















































一 般 是 将 类 的 声明 放 在 指定 的 头 文件 中 ， 如 果 想 使 用 这 个 类 ， 直 接 包 含 这 个 头 文件 即 可 。 因 为 在 头 文件 中 有 类 的 声明 ， 所 以 可 以 直接 在 程序 中 用 这 个 类 来 定义 对 象 。 为 了 实现 信息 隐蔽 ， 会 把 类 成 
员 函 数 的 定义 放 在 另 一 个 文件 中 ， 而 不 放 在 头 文件 中 。 



































例如 ， 可 以 将 类 student 的 声明 放 在 student.h 中 。 








【 例 2.5】 ”类 的 定义 与 使 用 。 














student.h 中 的 代码 为 : 





class CStudent( 
public: 

void display(); 
private: 

int num; 

char name[20]; 

int age; 


H 





student.cpp 中 的 代码 为 : 





#include<iostream> 
#include "student.h" // 这 里 需要 include 这 个 头 文件 ， 否 则 无 法 找到 Student 类 
using namespace std; 
void CStudent: :display () ( // 这 里 要 注 明 是 Student 类 的 
cout««"num: "««num««endl1; 
cout««"name: "««name««endl1; 
cout««"age: "««age««endl; 
} 








main.cpp 中 的 代码 为 : 

#include<iostream> 

#include "student.h" // 注意 这 里 是 双 引 号 

int main(){ 
CStudent stul; // 定义 Stul 对 象 
stul.display(); // 指向 stul 对 象 的 成 员 函 数 
return 0; 





执行 以 下 这 3 行 命令 即 可 编译 成 功 : 





g++ -c student.cpp 
g++ -c main.cpp 
g++ -o main main.o student.o 





编译 后 ， 会 生成 main 文 件 ， 执 行 ./main 命 令 ， 获 得 程序 的 执行 结果 为 : 





num:0 
name: 
age:0 








这 种 结果 是 由 于 还 没有 对 数据 成 员 进 行 初始 化 导致 的 ， 下 面 的 一 节 会 介绍 如 何 初 始 化 一 个 对 象 。 


例 2.5 中 定义 了 一 个 类 CStudent， 所 有 的 数据 成 员 和 成 员 函 数 都 声明 在 头 文件 student.h 中 ， 而 成 员 函 数 的 定义 则 是 在 .cpp 文 件 student.cpp 中 。main.cpp 中 要 使 用 CStudent 类 时 需要 把 头 文件 
student.h 包 含 进来 。 编 译 时 ， 编 译 嚣 g++ 会 把 main.cpp 和 student.cpp 分 别 编译 成 main.o 和 student.o， 再 把 main.o 和 student.o 链 接 成 可 执行 文件 main， 图 2-2 展 示 了 这 一 过 程 。 

















student.cpp 


student.o 





编译 与 链接 的 相关 知识 会 在 第 4 章 详细 展开 ， 这 里 只 作 简 

















4 构造 函数 


数据 成 员 是 不 能 在 类 中 初始 化 的 ， 而 构造 函数 ， 正 是 为 此 而 生 ， 主 











构造 函数 的 名 字 必 须 与 类 名 相同 ， 而 不 能 由 用 户 任意 命名 ， 以 便 编 译 系统 能 识别 它 并 把 它 作为 构造 函数 处 理 。 




















【 例 2.6】 ”构造 函数 的 定义 。 


class Timef 
public: 
Time (){ // 这 就 是 构造 函 教 
hour-0; 
minute-0; 
second-0; 
} 
set time(); 
get time(); 
private: 
int hour,minute, second; 


H 





图 2-2 ”编译 与 链接 





main.cpp 


main.o 















































来 处 理 数据 成 员 的 初始 化 。 它 不 需 








户 调用 ， 而 是 在 建立 对 象 时 自动 执行 的 。 











它 是 一 个 没有 返回 值 的 函数 ， 构 造 函 数 在 类 中 定义 如 例 2.6 所 示 。 





构造 函数 也 可 以 在 类 外 定义 ， 如 例 2.7 所 示 。 


【 例 2.7】 在 类 外 定义 构造 函数 。 


class Time{ 
Public: 
Time(); // 对 构造 函数 进行 声明 
set time(); 
get time(); 
private: 
int hour,minute, second; 


Nu 


hour-0; 
minute-0; 
second-0; 


在 构造 函数 的 函数 体 中 ， 不 仅 可 以 对 数据 成 员 赋值 ， 也 可 以 包含 其 他 语句 。 不 过 不 提倡 在 构造 函数 中 加 入 与 初始 化 无 关 的 内 容 ， 以 保证 程序 清晰 。 如 果 





Time: :Time () { // 定义 构造 函数 ， 需 要 加 上 类 名 和 域 限定 符 ": :" 


自动 为 其 生成 一 个 构造 函数 ， 只 是 这 个 构造 函数 的 函数 体 是 空 的 ， 什 么 也 不 做 ， 当 然 也 不 进行 初始 化 。 














I 








自己 没有 定义 构造 函数 ， 那 么 C+ + 系统 就 会 














构造 函数 分 为 不 带 参数 的 构造 函数 与 带 参数 的 构造 函数 。 不 带 参数 的 构造 函数 使 该 类 的 每 一 个 对 象 都 得 到 相同 的 初始 值 ; 带 参数 的 构造 函数 则 可 以 方便 地 实现 对 不 同 的 对 象 进行 不 同 的 初始 化 。 

















【 例 2.8】 。 带 参数 的 构造 函数 的 使 用 举例 。 











#include<iostream> 
using namespace std; 
#define pi 3.1415 
class Circle{ 


public: 
Circle (int r); // 形 参 列表 
double Area(); 

private: 
int radius; // 数据 成 员 


H 

Circle::Circle(int r)( 
radius-r; 

} 

double Circle::Area(){ 
return pi*radius*radius; 


} 


int main()( 
Circle cirl(10); 
cout««"cirl's area: "««cirl.Area()««endl; 
Circle cir2(1); 
cout««"cir2's area: "««cir2.Area()««endl; 
return 0; 


程序 的 执行 结果 是 : 


cirl's area: 314.15 
cir2's area: 3.1415 














例 2.8 中 的 构造 函数 带 了 一 个 整 型 的 参数 ， 并 在 构造 图 数 中 将 [参数 赋值 给 了 成 员 变量 radius。 定 义 对 象 时 可 利用 构造 函数 直接 对 成 员 变量 赋值 。 


























另外 ，C++ 还 提供 另 一 种 初始 化 数据 成 员 的 方法 : 参数 初始 化 表 。 这 种 方法 不 在 函数 体内 对 数据 成 员 初始 化 ， 而 是 在 函数 首部 实现 。 例 2.8 中 的 构造 函数 可 以 改写 为 下 列 形式 : 


Circle::Circle (int r):radius (r)() // 后 面 没有 分 号 





在 C++ 中 ， 一 个 类 可 以 同时 定义 多 个 构造 函数 ， 以 提供 不 同 的 初始 化 方法 。 这 些 构造 函数 的 参数 个 数 不 同 或 参数 的 类 型 不 同 ， 这 就 是 构造 函数 的 

















【 例 2.9】 ”构造 函数 重 载 的 使 














#include <iostream> 

using namespace std; 

class Box( 

public: 
Box () ; // 声明 一 个 无 参 的 构造 函数 
/* 声 明 一 个 有 参 的 构造 函数 ， 并 用 参数 的 初始 化 列表 对 数据 成 员 初 始 化 */ 
Box (int h,int w,int 1):height (h),width (w),length(1) () 
int volume(); 

private: 
int height, width, length; 

H 

Box: :Box () ( // 定义 无 参 的 构造 函数 
height-1; 
width-2; 
length-3; 


int Box: :volume ()( 
return height*width*length; 


int main()( 





Box boxl; // 不 指定 实 参 
cout««"boxl's volume: "««boxl.volume ()««endl; 
Box box2(2,5,10); // 指定 实 参 
cout««"box2's volume: "<<box2.volume()<<endl; 
return 0; 

} 

程序 的 执行 结果 是 : 





boxl's Volume: 6 
box2's Volume: 100 




















例 2.9 中 定义 了 两 个 构造 函数 ， 一 个 是 无 参 的 ， 一 个 是 有 参 的， 两 个 函数 的 函数 名 一 样 ， 但 参数 格式 不 一 样 ， 所 以 是 函数 重 载 。 若 定义 对 象 时 不 指定 实 参 ， 则 调用 无 参 的 构造 函数 。 























调用 构造 函数 时 不 必 给 出 实 参 的 构造 函数 ， 称 为 默认 构造 函数 。 无 参 的 构造 函数 属于 默认 构造 函数 。 一 个 类 只 能 有 一 个 默认 构造 函数 。 即 使 一 个 类 中 有 多 个 构造 函数 ， 但 建立 对 象 时 ， 都 只 执行 其 中 一 
个 构造 函数 。 


构造 函数 中 的 参数 的 值 ， 可 以 通过 实 参 传递 ， 也 可 以 指定 为 某 些 默认 值 。 











【 例 2.10】 构造 函数 默认 参数 的 使 

















#include <iostream> 

using namespace std; 

class Box{ 

public: 
Box (int h-2,int w-2,int 1-2); // 在 声明 构造 函数 时 指定 默认 参数 
int volume () 

private: 
int height, width, length; 


] 

Box::Box(int hv int w,int len){ // 在 定义 函数 时 可 以 不 指定 默认 参数 
height-h; 
width-w; 
length-len; 


int Box::volume (){ 
return height*width*length; 


int main(){ 


Box boxl(1); // 不 指定 第 2、3 个 实 参 
cout««"boxl's volume: "««boxl.volume ()««endl; 
Box box2 (1,3); // 不 指定 第 3 个 实 参 
cout««"box2's volume: "<<box2.volume()<<endl; 
return 0; 

} 

程序 的 执行 结果 是 : 





boxl's volume:4 
box2's volume:6 








例 2.10 中 定义 了 一 个 带 有 默认 参数 的 构造 函数 ， 是 在 声明 时 指定 默认 参数 ， 而 定义 时 则 可 以 不 指定 默认 参数 。 定 义 对 象 时 ， 可 以 传 0~3 个 参数 ， 传 了 几 个 参数 ， 就 蔡 换 前 面 的 几 个 参数 ， 其 余 都 还 是 使 
默认 参数 。 












































使 用 默认 参数 的 好 处 在 于 : 调用 构造 函数 时 就 算 没 有 提供 参数 也 不 会 出 错 ， 且 对 每 一 个 对 象 能 有 相同 的 初始 化 状况 。 











不 过 ， 应 该 在 声明 构造 函数 默认 值 时 指定 默认 参数 值 ， 而 不 能 只 在 定义 构造 函数 时 指定 默认 参数 值 。 如 果 构 造 函数 中 的 参数 全 指定 了 默认 值 ， 则 在 定义 对 象 时 ， 可 给 一 个 实 参 或 多 个 实 参 ， 也 可 以 不 给 
实 参 。 


一 个 类 中 如 果 定 义 了 全 是 默认 参数 的 构造 函数 后 ， 就 不 能 再 定义 重 载 构造 函数 了 。 假 设 Box 类 定义 了 以 下 3 个 构造 函数 : 








Box (int -10,int -10,int -10); 
Box () 7 
Box (int,int); 





若 有 以 下 定义 语句 ， 思 考 注释 中 的 问题 : 





Box boxl; 
Box box2 (15,30); 


// 是 调用 上 面 的 第 一 个 默认 参数 的 构造 函数 ， 还 是 第 二 个 默认 构造 函数 ? 
// 是 调用 上 面 的 第 一 个 默认 参数 的 构造 函数 ， 还 是 第 三 个 构造 函数 ? 





动 执行 的 。 


5. 析 构 函 数 


析 构 函数 的 名 字 是 类 名 的 前 面 加 一 个 





程序 执行 析 构 函 数 的 时 机 有 以 下 4 种 。 


(1) 如 果 在 函数 中 定义 了 一 个 对 象 ， 











(2) static 局 部 对 象 在 函数 调 F 








结束 时 对 象 不 释放 ， 所 以 


“~” 符 号 。 在 C++ 中 ， 








当 这 个 函数 调 














(3) 全 局 对 象 则 是 在 程序 流程 离开 其 作 





























(4) 用 new 建 立 的 对 象 ， 








析 构 函数 的 作 




















对 象 之 后 所 执行 的 任何 操作 。 








[5/2.11] — 析 构 函数 的 使 

















delete 释 放 该 对 象 时 ， 会 调 有 


不 是 删除 对 象 ， 而 是 在 撤销 对 象 占 

















域 (如 main 函 数 结束 或 调 





























该 对 象 的 析 构 函数 。 














方法 举例 。 


结束 时 ， 对 象 会 被 释放 ， 且 在 对 象 释放 前 会 


“~” 符 号 是 位 取 反 运 算 符 ， 类 似 地 ， 析 构 函 数 的 作 





也 不 执行 析 构 函数 ， 只 有 在 main 函 数 结束 或 调用 exit 函 数 结束 程序 时 ， 才 调 


exit 函 数 ) 时 ， 才 会 执行 该 全 局 对 象 的 析 构 


的 内 存 前 完成 一 些 清理 工作 ， 使 得 这 些 内 存 可 以 供 新 对 象 使 























与 构造 函数 相反 。 它 也 不 需要 


自动 执行 析 构 函数 。 














ea 




















。 析 构 函数 的 作 











也 不 限于 释放 资源 方 








户 来 调 


static 局 部 对 象 的 析 构 函数 。 








它 ， 不 过 ， 它 是 在 对 象 声 明 周 期 结束 时 自 

















面 ， 它 还 可 以 被 




















希望 在 最 后 一 次 








#include<iostream> 
using namespace std; 
class Box{ 


public: 
Box (int h-2,int w-2,int 1-2); 
~Box () { 


cout««"Destructor called. 


int volume () 


"«xendl; 


// MO AK 
// 析 构 函数 里 的 内 容 


{ 
return height*width*length; 


} 
private: 
int height, width, length; 


Box::Box(int h,int w,int len)( 
height-h; 
width-w; 
length-len; 


int main(){ 
Box boxl; 


cout««"The volume of boxl is " 


cout««"hello."««endl; 
return 0; 


"««box1 . volume () ««endl; 





程序 的 运行 结果 : 





The volume of boxl is 8 
hello. 
Destructor called. 





数据 当成 全 
建 了 多 少 个 该 类 的 对 象 。 
private 或 protected 的 范 世 


例 2.11 中 定义 了 类 Box 的 析 构 函数 ， 析 构 函数 中 输出 Destructor called.， 也 就 是 析 构 函数 被 执行 时 就 会 输出 这 条 消息 。 由 程序 的 执行 结果 可 以 看 出 ， 析 构 函 数 是 对 象 释放 内 存 前 执行 的 。 














如 果 








6 .静态 数据 成 员 


有 时 需要 为 某 个 类 的 所 有 对 象 分 配 一 个 单一 的 存储 空间 。 在 C 语 言 


没有 编写 析 构 函数 ， 编 译 系统 会 





自动 生成 一 个 默认 的 析 构 函数 ， 但 不 进行 任何 操作 ， 所 以 许多 简 生 














的 类 中 没有 





显 式 的 析 构 函数 。 














全 





， 可 以 使 

















是 











xxx.h 类 型 文件 中 : 





所 有 这 些 对 象 的 静态 数据 成 员 都 共享 这 一 块 静态 存储 空间 











局 变量 ， 但 这 样 很 不 安全 。 




















局 变量 那样 去 存储 ， 但 又 被 隐藏 在 类 的 内 部 ， 而 且 清 楚 地 与 这 个 类 相 联系 ， 这 种 处 理 方法 就 是 最 理想 的 。 这 个 可 以 





因为 不 管 产生 了 多 少 对 象 ， 类 的 静态 数据 成 员 都 有 着 单一 的 存储 空间 ， 所 以 存储 空间 必须 定义 在 一 个 
现在 类 的 外 部 而 且 只 能 定义 一 次 ”。 




















和 一 的 地 方 。 如 果 一 个 静态 数据 成 员 被 声明 而 没有 被 定义 ， 链 接 器 会 报告 一 个 错误 : 
因此 静态 数据 成 员 的 声明 通常 会 放 在 一 个 类 的 实现 文件 中 。 举 例如 下 所 示 。 








局 数据 可 以 被 任何 人 修改 ， 而 且 在 一 个 项 目 中 ， 它 很 容易 和 其 他 名 字 冲 突 。 如 果 可 以 把 
类 的 静态 数据 成 员 来 实现 。 类 的 静态 成 员 拥 有 一 块 单独 的 存储 区 ， 而 不 管 创 
， 这 就 为 这 些 对 象 提供 了 一 种 互相 通信 的 方法 。 静 态 数据 成 员 是 属于 类 的 ， 它 只 在 类 的 范围 








内 有 效 ， 可 以 是 public、 





class basef 
Public: 
static int var; 


H 


// 声明 静态 数据 成 员 





Xxxx.cpp 类 型 文件 中 : 





int base::var-10; 


在 头 文件 中 定义 (初始 化 ) 静态 


C++ 静态 数据 成 员 被 类 的 所 有 对 象 所 共享 ， 包 括 该 类 的 派 4 
个 数据 成 员 的 值 同时 都 改变 了 ， 





[512.12] 


员 容 易 引起 本 


这 样 可 以 节约 空间 ， 提 高 效率 。 下 面 程序 














静态 的 数据 成 员 基 类 和 派生 类 对 象 共享 。 


// 定义 静态 数据 成 员 , 不 必 在 初始 化 语句 里 加 上 static 


量 复 定义 的 错误 ， 比 如 这 个 头 文件 同时 被 多 个 .cpp 文 件 所 包含 的 时 候 。 即 使 加 上 #ifndef#define#endif 或 者 #pragma once 也 不 行 。 





影响 派生 类 对 象 和 基 类 对 象 的 情况 。 


上 类 的 对 象 。 派生 类 对 象 与 基 类 对 象 共享 基 类 的 静态 数据 成 员 。 静 态 的 数据 成 员 在 内 存 中 只 占 一 份 空间 。 如 果 改 变 它 的 值 ， 则 在 各 个 对 象 中 这 
展示 了 修改 基 类 的 静态 数据 成 员 ， 同 


fincludeciostream» 
using namespace std; 
class Basef 
public: 
static int var; 
H 
int Base::var-10; 
class Derived:public Base( 
H 
int main(){ 
Base basel; 
basel.vart*; // 通过 对 象 名 引用 
cout««basel.var««endl; // 输出 11 
Base base2; 
base2.var++; 
cout<<base2.var<<endl; // 输出 12 
Derived derivedl; 
derivedl.vartt; 


cout««derivedl.var««endl; // 输出 13 
Base: :Var++7 // 通过 类 名 引用 
cout««derivedl.var««endl; // 输出 14 
return 0; 

} 

程序 的 执行 结果 是 : 

11 

12 

13 

14 





例 2.12 中 在 基 类 Base 中 定义 了 一 个 静态 数据 成 员 var， 类 Derived 继 承 了 类 Base。 无 论 是 通过 基 类 对 象 ， 或 者 是 派生 类 对 象 ， 都 可 以 改变 静态 数据 成 员 var 的 值 。 








如 果 只 声明 了 类 而 未 定义 对 象 ， 类 的 一 般 数据 成 员 是 不 占 内存 空 间 的 ， 只 有 在 定义 对 象 时 才 会 为 对 象 的 数据 成 员 分 配 空间 。 但 是 静态 数据 成 员 不 属于 某 一 个 对 象 ， 所 以 在 为 对 象 所 分 配 的 空间 中 不 包括 








静态 数据 成 员 所 占 的 空间 ， 静 态 数据 成 员 是 在 所 有 对 象 之 外 单独 开辟 一 段 空 间 来 存放 。 只 要 在 类 中 定义 了 静态 数据 成 员 ， 即 使 不 定义 对 象 ， 也 为 静态 数据 成 员 分 配 了 空间 ， 























在 一 个 类 中 可 以 有 一 个 或 多 个 静态 数据 成 员 ， 所 有 对 象 都 共享 这 些 静 态 数据 成 员 ， 都 可 以 引用 它 。 











它 可 以 被 引用 。 











如 果 在 一 个 函数 中 定义 了 静态 变量 ， 在 函数 结束 时 该 静态 变量 并 不 被 释放 ， 仍 然 存 在 并 保留 其 值 。 静 态 数据 成 员 也 类 似 ， 它 不 随 对 象 的 建立 而 分 配 空间 ， 也 不 随 对 象 的 撤销 而 释放 。 静 态 数据 成 员 是 程 


序 在 编译 时 被 分 配 空间 ， 到 程序 结束 时 释放 空间 。 














静态 数据 成 员 可 以 通过 对 象 名 引用 ， 也 可 以 通过 类 名 来 引用 。 




















与 数据 成 员 类 似 ， 成 员 函 数 也 可 以 定义 为 静态 的 ， 在 类 中 声明 函数 的 前 面 加 static 关 键 字 就 成 了 静态 成 员 函 数 ， 如 : 





static int volume(); 












































和 静态 数据 成 员 一 样 ， 静 态 成 员 函 数 也 是 类 的 一 部 分 ， 而 不 是 对 象 的 一 部 分 。 如 果 要 在 类 外 调用 公用 的 静态 成 员 函 数 ， 类 名 和 域 运算 符 “: : ”， 如 : 





Box::volume( ); 














实际 上 也 人 允许 通过 对 象 名 调用 静态 成 员 函 数 ， 如 : 





























但 这 并 不 意味 着 此 函数 是 属于 对 象 3 的 ， 而 只 是 用 a 的 类 型 而 已 。 











与 静态 数据 成 员 不 同 ， 静 态 成 员 函 数 的 作用 不 是 为 了 对 象 之 间 的 沟通 ， 而 是 为 了 能 处 理 静态 数据 成 员 。 




















当 调用 一 个 对 象 的 成 员 函 数 ( 非 静 态 成 员 函 数 ) 时 ， 系 统 会 把 该 对 象 的 起 始 地 址 赋 给 成 员 函 数 的 this 指 针 。 而 静态 成 员 函 数 并 不 属于 某 一 对 象 ， 它 与 任何 对 象 都 无 关 ， 
既然 它 没 有 指向 某 一 对 象 ， 也 就 无 法 对 一 个 对 象 中 的 非 静态 成 员 进 行 默认 访问 ( 即 在 引用 数据 成 员 时 不 指定 对 象 名 ) 。 



































因此 静态 成 员 函 数 没 有 this 指 针 。 


可 以 说 ， 静 态 成 员 函 数 与 非 静态 成 员 函 数 的 根本 区 别 是 : 非 静态 成 员 函 数 有 this 指 针 ， 而 静态 成 员 函 数 没 有 this 指 针 。 由 此 决定 了 静态 成 员 函 数 不 能 访问 本 类 中 的 非 静态 成 员 。 





















































静态 成 员 函 数 可 以 直接 引用 本 类 中 的 静态 数据 成 员 ， 因 为 静态 成 员 同样 是 属于 类 的 ， 可 以 直接 引用 。 在 C++ 程序 中 ， 静 态 成 员 函 数 主要 用 来 访问 静态 数据 成 员 ， 而 不 访问 非 静态 成 员 。 








假如 在 一 个 静态 成 员 函 数 中 有 以 下 语句 : 





cout««height««endl; // height P9] static, 则 引用 本 类 中 的 静态 成 员 ， 合 法 
cout««width««endl; // 若 width 是 非 静 态 数 据 成 员 ， 不 合法 




















但 是 ， 并 不 是 绝对 不 能 引用 本 类 中 的 非 静态 成 员 ， 只 是 不 能 进行 默认 访问 ， 因 为 无 法 知道 应 该 去 找 哪个 对 象 。 如 果 一 定 要 引用 本 类 的 非 静态 成 员 ， 应 该 加 对 象 名 和 成 员 运 算 符 “.”， 如 : 




















cout««a .width««endl; // 引用 本 类 对 象 a 中 的 非 静态 成 员 


























假设 a 已 定义 为 Box 类 对 象 ， 且 在 当前 作用 域内 有 效 ， 则 此 语句 合法 。 不 过 ， 最 好 养 成 这 样 的 习惯 : 只 用 静态 成 员 函 数 引 用 静态 数据 成 员 ， 而 不 引用 非 静态 数据 成 员 。 这 样 思 路 更 清晰 、 逻 辑 更 清楚 ， 不 


易 出 错 。 








【 例 2.13】 静态 成 员 函 数 的 使 用 方法 举例 。 

















#include<iostream> 
using namespace std; 
class CStudent{ 
public: 
CStudent (int n,int s) :num(n) ,score (s) {} // 定义 构造 函数 
void total(); 
static double average(); 
private: 
int num; 
int score; 
static int count; 
static int sum; // 这 两 个 数据 成 员 是 所 有 对 象 共享 的 


H 
int CStudent::count-0; // 定义 静态 数据 成 员 


int CStudent::sum-0; 








void CStudent::total()( // 定义 非 静态 成 员 函 数 
sumt-score; // 非 静态 数据 成 员 函 数 中 可 使 用 静态 数据 成 
// 员 、 非 静态 数据 成 员 
counttt; 
l 
double CStudent::average()( // 定义 静态 成 员 函 数 
return sum*1l.0/count; // 可 以 直接 引用 静态 数据 成 员 ， 不 用 加 类 名 
} 
int main(){ 
CStudent stul(1,100); 
stul.total(); // 调用 对 象 的 非 静 态 成 员 函 数 
CStudent stu2 (2,98); 
stu2.total(); 
CStudent stu3 (3,99); 
stu3.total(); 
cout«« CStudent: : average () ««endl; // 调用 类 的 静态 成 员 函 数 ， 输 出 99 
程序 的 执行 结果 是 : 





99 














例 2.13 中 声明 了 一 个 CStudent 类 ， 类 中 有 静态 成 员 函 数 average、 静 态 数据 成 员 count 和 sum。 静态 数据 成 员 count 和 sum 必 须 在 类 的 外 部 定义 ， 在 非 静 态 成 员 函 数 total 中 可 以 使 用 静态 数据 成 员 、 非 











静态 数据 成 员 ， 而 在 静态 成 员 函 数 中 则 可 以 不 加 类 名 直接 引用 静态 数据 成 员 。 











8. 对 象 的 存储 空间 
































很 多 C++ 书 籍 中 都 介绍 过 一 个 对 象 需要 占用 多 大 的 内 存 空 间 ， 最 权威 的 结论 是 : 非 静态 成 员 变量 总 和 加 上 编译 器 为 了 CPU 计算 做 出 的 数据 对 齐 处 理 和 支持 虚 函 数 所 产生 的 负担 的 总 和 。 下 面 分 别 看 看 数 














据 成 员 、 成 员 函 数 、 构 造 函 数 、 析 构 函 数 、 虚 函数 的 空间 占用 情况 。 








先 来 看 看 一 个 空 类 的 存储 空间 是 多 少 个 Byte 呢 ?可 以 看 例 2.14 的 程序 。 


[52.14] ” 空 类 存储 空间 的 计算 。 

















#include<iostream> 
using namespace std; 
class CBox( 


int main()( 
CBox boxobj; 
cout««sizeof (boxobj)««endl;// 输出 1 
return 0 





程序 的 执行 结果 是 : 








例 2.14 中 定义 了 一 个 空 类 CBox， 里 面 既 没有 数据 成 员 ， 也 没有 成 员 函 数 。 程 序 执行 结果 显示 它 的 大 小 为 1。 


空 类 型 对 象 中 不 包含 任何 信息 ， 应 该 大 小 为 0。 但 是 当 声 明 该 类 型 的 对 象 的 时 候 ， 它 必须 在 内 存 中 占有 一 定 的 空间 ， 否 则 无 法 使 
实例 占 1Byte 空 间 。 


【 例 2.15】 ”只 有 成 员 变 量 的 类 的 存储 空间 计算 。 























这 些 对 象 。 至 于 占 











多 少 内 存 ， 由 编译 器 决定 。C+ + 中 每 个 空 类 型 的 





#include<iostream> 
using namespace std; 
class CBox{ 
int length, width, height; 
H 
int main()( 
CBox boxobj; 
cout««sizeof (boxobj) ««endl; 
return 0; 


程序 的 执行 结果 是 : 





12 





例 2.15 中 ， 类 CBox 中 只 有 3 个 成 员 变 量 ， 由 于 整 型 变量 占 4Byte， 所 以 对 象 所 占 的 空间 就 是 12Byte。 那 静态 成 员 变 量 是 否 也 占 存储 空间 呢 ? 


【 例 2.16】 ”有 成 员 变 量 和 静态 成 员 变 量 的 类 的 存储 空间 计算 。 





#include<iostream> 

using namespace std; 

class CBox( 
int length, width, height; 
static int count; 

H 

int main()( 
CBox boxobj; 
cout««sizeof (boxobj) ««endl; 
return 0; 





程序 的 执行 结果 是 : 





12 








例 2.16 中 ， 类 CBox 中 有 3 个 普通 数据 成 员 和 1 个 静态 数据 成 员 ， 比 例 2.14 中 多 了 一 个 静态 数据 成 员 ， 但 是 程序 的 执行 结果 还 是 12， 也 就 证 明了 静态 数 拉 


【 例 2.17】 类 中 只 有 1 个 成 员 函 数 的 存储 空间 计算 。 





居 成 员 是 不 占 对 象 的 内 存 空间 的 。 





#include<iostream> 
using namespace std; 
class CBox( 

int foo; 


H 

int main()( 
CBox boxobj; 
cout««sizeof (boxobj) ««endl; 
return 0; 





程序 的 执行 结果 是 : 





例 2.17 中 类 CBox 中 只 有 一 个 成 员 函 数 ， 类 CBox 的 对 象 boxobj 的 大 小 却 只 有 1Byte， 和 空 类 对 象 是 一 样 的 ， 所 以 可 以 得 出 ， 成 员 函 数 是 不 占 空间 的 。 








【 例 2.18】 类 中 构造 函数 、 析 构 函 数 的 空间 占用 情况 。 














#include<iostream> 
using namespace std; 
class CBox{ 
public: 
CBox () (); 
^CBox() (); 
H 
int main(){ 
CBox boxobj; 
cout««sizeof (boxobj) ««endl; 
return 0; 





程序 的 执行 结果 是 : 








例 2.18 中 类 CBox 中 只 有 构造 函数 和 析 构 函数 ， 类 CBox 的 对 象 boxobj 的 大 小 也 只 有 1Byte， 和 空 类 对 象 是 一 样 的 ， 所 以 可 以 得 出 ， 构 造 函数 和 析 构 函数 也 是 不 占 空间 的 。 


【 例 2.19】 ”类 中 有 虚 的 析 构 函数 的 空间 计算 。 





fincludeciostream» 
using namespace std; 
class CBox{ 
public: 
CBox 0 {}; 
virtual -CBox()(); 
H 
int main()( 
CBox boxobj; 
cout««sizeof (boxobj) ««endl; // 输出 4 
return 0; 


} 





程序 的 执行 结果 是 : 





例 2.19 中 ， 类 CBox 中 有 1 个 构造 函数 和 1 个 虚 的 析 构 函数 ， 程 序 的 执行 结果 是 8。 事 实 上 ， 编 译 器 为 了 支持 虚 函 数 ， 会 产生 额外 的 负担 ， 这 正 是 指向 虚 函 数 表 的 指针 的 大 小 。 (指针 变量 在 64 位 的 机 器 上 
占 8Byte。) 如 果 一 个 类 中 有 一 个 或 者 多 个 虚 函 数 ， 没 有 成 员 变 量 ， 那 么 类 相当 于 含有 一 个 指向 虚 函 数 表 的 指针 ， 占 8Byte。 








【 例 2.20】 ”继承 空 类 和 多 重 继承 空 类 存储 空间 的 计算 。 





#include<iostream> 
using namespace std; 
class A{ 


class B( 

sss C:public A( 

ME D:public virtual B( 
MR E:public A,public B( 


H 
int main()( 
a; 
Bb; 
Cc; 
Dd; 
Ee; 
cout««"sizeof (a) : " ««sizeof (a) 
cout««"sizeof (b) : "««sizeof (b) 
cout««"sizeof (c) : "««sizeof (c) ««endl; 
cout««"sizeof (d) : " ««sizeof (d) 
( (e) 


cout««"sizeof (e) : "««sizeof 
return 0; 





程序 的 执行 结果 是 : 
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例 2.20 中 定义 了 一 个 空 类 A 和 B， 类 C 继 承 了 类 A， 类 D 继 承 了 虚 基 类 B， 类 FE 继 承 了 类 A 和 类 B。 这 些 类 的 对 象 所 占 的 空间 都 是 1Byte。 由 此 可 见 ， 单 一 继承 的 空 类 空间 也 是 1， 多 重 继承 的 空 类 空间 还 是 1， 
但 是 虚 继承 涉及 虚 表 ( 虚 指针 ) ， 所 以 sizeof (d) =8。 









































综 上 所 述 ， 每 个 对 象 所 占用 的 存储 空间 只 是 该 对 象 的 非 静态 数据 成 员 的 总 和 和， 其 他 都 不 占用 存储 空间 ， 包 括 成 员 函 数 和 静态 数据 成 员 。 函 数 代码 是 存储 在 对 象 空间 之 外 的 ， 而 且 ， 函 数 代码 段 是 公 
的 ， 即 如 果 对 同一 个 类 定义 了 10 个 对 象 ， 这 些 对 象 的 成 员 函 数 对 应 的 是 同一 个 函数 代码 段 ， 而 不 是 10 个 不 同 的 函数 代码 段 。 





9.this 指 针 


每 个 对 象 中 的 数据 成 员 都 分 别 占有 存储 空间 ， 如 果 对 同一 个 类 定义 了 n 个 对 象 ， 则 有 n 组 同样 大 小 的 空间 以 存放 n 个 对 象 中 的 数据 成 
数 引 用 数据 成 员 时 ， 怎 么 能 保证 所 引用 的 是 所 指定 的 对 象 的 数据 成 员 呢 ? 





。 不 同 对 象 都 调用 同一 个 函数 代码 段 。 那 么 ， 当 不 同 对 象 的 成 员 函 


zn 












































假设 ， 对 于 上 述 例子 中 定义 的 Box 类 ， 定 义 了 3 个 同类 对 象 a8、b、c。 如 果 有 a.volume () ， 应 该 是 引用 对 象 a 中 的 height、width 和 length， 以 计算 出 箱子 a 的 体积 ; 如 果 有 b.volume () ， 应 该 是 引 





























对 象 b 中 的 height、width 和 length， 计 算出 箱子 b 的 体积 。 而 现在 都 用 同一 个 函数 段 ， 系 统 怎样 使 它 分 别 引 用 a 或 b 中 的 数据 成 员 呢 ? 


























在 每 一 个 成 员 函 数 中 都 包含 一 个 特殊 的 指针 ， 这 个 指针 的 名 字 是 固定 的 ， 称 为 this 指 针 。 它 是 指向 本 类 对 象 的 指针 ， 它 的 值 是 当前 被 调用 的 成 员 函 数 所 在 的 对 象 的 起 始 地 址 。 例 如 ， 当 调用 成 员 函 数 
avolume 时 ， 编 译 系统 就 把 对 象 3 的 起 始 地 址 赋 给 this 指 针 ， 在 成 员 函 数 引 用 数据 成 员 时 ， 就 按照 this 的 指向 找到 对 象 a 的 数据 成 员 。 例 如 volume 函 数 要 计算 height*width*length 的 值 ， 实 际 上 是 执行 : 






































(this-»height)* (this-»width)* (this->length) 





由 于 当前 this 指 向 a， 因 此 相当 于 执行 : 














(a.height)*(a.width)*( a.length) 





这 就 计算 出 箱子 a 的 体积 。 同 样 如 果 有 b.volume () ， 编 译 系 统 就 把 对 象 b 的 起 始 地 址 赋 给 成 员 函 数 volume 的 this 指 针 ， 显 然 计 算出 来 的 是 箱子 b 的 体积 。 














this 指 针 是 隐 式 使 用 的 ， 它 是 作为 参数 被 传递 给 成 员 函 数 。 本 来 ， 成 员 函 数 volume 的 定义 如 下 : 














int Box::Volume () { 
return (height*width*length); 
} 





C++ 把 它 处 理 为 : 





int Box::volume (Box *this){ 
return (this-»height * this-»width * this-»length); 
} 














即 在 成 员 函 数 的 形 参 表 列 中 增加 一 个 this 指 针 。 在 调用 该 成 员 函 数 时 ， 实 际 上 是 用 以 下 方式 调用 的 : 























a.volume (&a); 














将 对 象 a 的 地 址 传 给 形 参 this 指 针 ， 然 后 按 this 的 指向 去 引用 其 他 成 员 。 




















需要 说 明 的 是 ， 这 些 都 是 编译 系统 自动 实现 的 ， 不 必 人 为 地 在 形 参 中 增加 this 指 针 ， 也 不 必 将 对 象 a 的 地 址 传 给 this 指 针 ， 但 在 需要 时 也 可 以 显 式 地 使 用 this 指 针 。 




















例如 在 Box 类 的 volume 函 数 中 ， 下 面 两 种 表示 方法 都 是 合法 的 、 相 互 等 价 的 : 














return (height * width * length); // 隐 伟 使 用 this 指 针 
return (this->height * this->width * this->length); // 显 式 使 用 this 指 针 


























可 以 用 *this 表 示 被 调用 的 成 员 函 数 所 在 的 对 象 ，*this 就 是 this 所 指向 的 对 象 ， 即 当前 的 对 象 。 例 如 在 成 员 函 数 a.volume () 的 函数 体 中 ， 如 果 出 现 #this， 它 就 是 对 象 3。 上 面 的 return 语 句 也 可 写成 : 

















return((*this).height * (*this) .width * (*this).length); 





Qua 


*this 两 侧 的 括号 不 能 省 略 ， 不 能 写成 *this.height。 因 为 成 员 运 算 符 “.” 的 优先 级 别 高 于 指针 运算 符 “*”， 因 此 ，*this.height 就 相当 于 * (this.height) ， 而 this.height 是 不 合法 的 ， 编 译 会 出 错 。 






























































所 谓 “ 调 用 对 象 3 的 成 员 函 数 f” ， 实 际 上 是 在 调用 成 员 函 数 f 时 使 this 指 针 指向 对 象 3， 从 而 访问 对 象 a 的 成 员 。 在 使 用 “调用 对 象 a 的 成 员 函 数 f” 时 ， 应 当 对 它 的 含义 有 正确 的 理解 。 


























(1) 只 能 在 成 员 函 数 中 使 用 ， 在 全 局 函数 、 静 态 成 员 函 数 中 都 不 能 使 用 this。 














(2) this 指 针 是 在 成 员 函 数 的 开始 前 构造 ， 并 在 成 员 函 数 的 结束 后 清除 。 

















(3) this 指 针 会 因 编译 器 不 同 而 有 不 同 的 存储 位 置 ， 可 能 是 栈 、 寄 存 器 或 全 局 变量 。 











(4) this 是 类 的 指针 。 














(5) 因为 this 指 针 只 有 在 成 员 函 数 中 才 有 定义 ， 所 以 获得 一 个 对 象 后 ， 不 能 通过 对 象 使 用 this 指 针 ， 所 以 也 就 无 法 知道 一 个 对 象 的 this 指 针 的 位 置 。 不 过 ， 可 以 在 成 员 函 数 中 指定 this 指 针 的 位 置 。 

















(6) 普通 的 类 函数 (不 论 是 非 静态 成 员 函 数 ， 还 是 静态 成 员 函 数 ) 都 不 会 创建 一 个 函数 表 来 保存 函数 指针 ， 只 有 虚 函 数 才 会 被 放 到 函数 表 中 。 
10. 类 模板 


有 时 ， 两 个 或 多 个 类 的 功能 是 相同 的 ， 但 仅仅 因为 数据 类 型 不 同 ， 就 要 分 别 定义 两 个 类 ， 如 下 面 的 例 2.21 声 明了 一 个 类 。 








【 例 2.21】 ”操作 整数 的 类 。 





class Operation int( 
public: 
Operation int(int a,int b):x(a),y(b) () 
int add()[ 
return xty; 


} 
int subtract (){ 
return x-y; 
} 
private: 
int x,y; 


H 











这 个 类 的 作用 是 两 个 整数 的 加 减 ， 如 果 要 对 两 个 浮 点 数 做 加 减 ， 就 又 得 新 定义 一 个 类 ， 比 如 例 2.22 所 示 。 





【 例 2.22】 ”操作 浮 点 数 的 类 。 


class Operation double( 
public: m 
Operation double (double a, double b):x(a),y(b) () 
double add()í 
return xty; 


l 
double subtract () { 
return x-y; 
} 
private: 
double x,y; 
H 


























因为 参数 的 类 型 不 同 ， 所 以 不 能 复 用 ， 这 也 使 得 代码 量 剧 增 。 为 了 解决 这 类 问题 ，C+ + 中 提供 了 类 模板 的 功能 。 可 以 先 声明 一 个 通用 的 类 模板 ， 这 个 类 模板 可 以 有 一 个 或 多 个 虚拟 的 类 型 参数 ， 对 以 上 
例子 中 的 两 个 类 ， 可 以 定义 如 例 2.23 这 样 的 类 模板 。 























【 例 2.23】 ”操作 两 个 数 的 类 模板 。 





template<class T> // 声明 一 个 模板 ， 虚 拟 类 型 名 为 Tf 
class Operation { 
public: 

Operation (T a, T b):x(a),y(b) t) 

T addat 


return xty; 


l 
T subtract()í 
return x-y; 


private: 
T x,y; 
H 








例 2.23 这 个 类 模板 与 上 面 的 类 相 比 ， 有 以 上 两 个 不 同 点 。 











(1) 声明 类 模板 时 增加 了 下 面 这 一 行 代码 : 


template «class 类 型 参数 名 > 








其 中 ，template 是 声明 类 模板 时 必须 写 的 关键 字 ， 意 思 是 “模板 ”。 关 键 字 class 后 的 类 型 参数 名 可 以 是 任意 的 合法 标识 符 ， 本 例 中 T 就 是 一 个 类 型 参数 名 。 


(2) 原 有 的 类 型 名 int 换 成 虚拟 类 型 参数 名 T。 

















在 建立 类 对 象 时 ， 如 果 将 实际 类 型 指定 为 int 型 ， 编 译 系统 就 会 用 int 取 代 T; 如 果 指定 为 double， 编 译 系统 就 会 用 double 取 代 T。 
































声明 一 个 类 模板 的 对 象 时 ， 实际 类 型 名 去 取代 虚拟 的 类 型 ， 这 样 才能 使 它 变 成 一 个 实际 的 对 象 ， 如 : 











Operation «int» opobj (1,2); 
































在 类 模板 名 之 后 的 尖 括 号 里 指定 实际 的 类 型 名 ， 这 样 在 编译 时 ， 编 译 系统 就 用 int 取 代 类 模板 中 的 类 型 参数 T， 这 样 就 把 类 模板 具体 化 了 ， 或 者 说 实际 化 了 。 例 2.24 中 实现 了 一 个 类 模板 ， 利 用 它 可 以 分 
别 对 两 个 整数 和 两 个 浮 点 数 进行 加 、 减 操作 。 














[52.24] 类 模板 实现 对 两 个 数 的 加 、 减 操作 。 

















#include <iostream> 
using namespace std; 
template<class T> // 声明 一 个 模板 ， 虚 拟 类 型 名 为 了 
class Operation { 
public: 

Operation (T a, T b):x(a),y(b) t) 

T add ( 

return xty; 


} 
T subtract (){ 
return x-y; 
} 
private: 
T x,y; 


int main(){ 
Operation «int» op int(1,2); 








cout««op int.add()««" "««op int.subtract ()««endl; // W83 -1 
Operation «double» op double(1.2,2.3); 
cout««op double.add()««" "««op double.subtract () ««end1; // d 53.5. -1.1 
return 0; 
} 
程序 的 执行 结果 是 : 
3-1 
: 





例 2.24 中 声明 了 一 个 类 模板 ， 可 以 对 两 个 相同 类 型 的 数 进行 加 、 减 操作 : 如 果 是 传 入 两 个 整数 ， 则 对 两 个 整数 进行 加 减 ， 如 果 传 入 两 个 浮 点 数 ， 则 对 两 个 浮 点 数 进行 加 减 。 


如 果 类 模板 的 成 员 函 数 是 在 类 外 定义 的 ， 则 需要 这 么 写 : 





template<class T» 
T Operation «T» :: add(){ 
return xty; 


} 








综 上 所 述 ， 可 以 这 样 声明 和 使 用 类 模板 。 








(1) 先 写 一 个 实际 的 类 。 








(2) 将 此 类 中 准备 改变 的 类 型 名 改 用 一 个 自己 指定 的 虚拟 类 型 名 。 











(3) 在 类 声明 前 面 加 入 一 行 ， 格 式 为 : template<class 虚 拟 类 型 参数 > 。 











(4) 用 类 模板 定义 对 象 时 用 以 下 形式 : 














类 模板 名 < 实际 类 型 名 > 对 象 名 ; 类 模板 名 < 实际 类 型 名 > 对 象 名 ( 实 参 表 列 ) ; 





(5) 如 果 在 类 模板 外 定义 成 员 函 数 ， 应 写成 类 模板 形式 : 





template «class 虚拟 类 型 参数 > 函数 类 型 类 模板 名 < 虚拟 类 型 参数 >: :成 员 函 数 名 (函数 形 参 表 列 ) {…} 





类 模板 是 对 一 批 仅 数据 成 员 类 型 不 同 的 类 的 抽象 ， 只 要 为 这 一 批 类 所 组 成 的 





11. 析 构 函 数 与 构造 函数 的 执行 顺序 

















前 面 齐 了 析 构 函数 执行 的 时 机 ， 下 面 再 来 对 比 下 构造 函数 和 析 构 函数 的 调 








顺序 。 首 先 看 下 





时 间 和 调 











【 例 2.25】 构造 函数 和 析 构 函数 的 执行 顺序 实例 。 


#include<iostream> 
using namespace std; 
class CBox{ 
public: 
CBox (int h,int w,int 1){ 
height-h; 
width-w; 
length-l; 
cout««"Constructor called."««endl; // 构造 函数 被 执行 时 输出 信息 
} 
^CBox (){ // Mp RE 
cout««"Destructor called."««length««endl; 
} 
int volume () { 
return height*width*length; 


// 析 构 函数 被 执行 时 输出 


} 

private: 
int height, width, length; 

H 

int main()( 
CBox box1 (1,2,3); 
cout<<box1.volume () ««endl; 
CBox box2 (2,3,4); 
cout<<box2 .volume ()««endl; 
return 0; 


整个 类 家 族 创 造 一 个 类 模板 ， 即 给 出 一 套 程序 代码 ， 就 可 以 

















来 生成 多 种 具体 的 类 ， 从 而 大 大 提高 编程 的 效率 。 


面包 含 构造 函数 和 析 构 函数 的 C+ + 程序 的 执行 结果 ， 以 此 来 判断 二 者 执行 的 顺序 。 





程序 的 执行 结果 为 : 





Constructor called. 


Constructor called. 
24 

Destructor called.4 
Destructor called.3 





例 2.25 中 声明 了 类 CBox， 类 中 有 一 个 构造 函数 和 
的 时 机 。 



































在 一 般 情况 下 ， 调 





析 构 函数 的 次 序 正好 与 调 





构造 函数 的 次 序 相 











: 最 先 被 调 





































































































































































































的 构造 函数 ， 其 对 应 的 〈 同 一 对 象 中 的 ) 析 构 


[一 个 析 构 函数 ， 当 构造 函数 运行 时 会 输出 一 句 话 ， 方 便 判 断 构造 施 数 执行 的 时 机 ; 同样 的 ， 当 析 构 函数 运行 时 也 会 输出 一 句 话 ， 方 便 判 断 析 构 函 数 执行 

















函数 最 后 被 调 


















































; 而 最 后 被 调 





的 构造 函数 ， 其 对 应 的 析 构 函数 最 先 被 
























































































































































调用 。 如 上 所 示 ， 先 执行 box2 的 析 构 函数 ， 再 执行 box1 的 析 构 函数 。 可 以 简 记 为 : 先 构 造 的 后 析 构 ， 后 构造 的 先 析 构 ， 它 相当 于 一 个 栈 ， 先 进 后 出 。 但 是 ， 并 不 是 在 任何 情况 下 都 是 按 这 一 原则 处 理 的 。 对 
象 可 以 在 不 同 的 作用 域 中 定义 ， 可 以 有 不 同 的 存储 类 别 ， 这 些 都 会 影响 调用 构造 函数 和 析 构 函数 的 时 机 。 下 面 归 纳 一 下 什么 时 候 调用 构造 函数 和 析 构 函数 。 
(1) 在 全 局 范围 中 定义 的 对 象 ( 即 在 所 有 函数 之 外 定义 的 对 象 ) ， 它 的 构造 函数 在 文件 中 的 所 有 函数 (包括 main 函 数 ) 执行 之 前 调用 。 但 如 果 一 个 程序 中 有 多 个 文件 ， 而 不 同 的 文件 中 都 定义 了 全 局 
对 象 ， 则 这 些 对 象 的 构造 函数 的 执行 顺序 是 不 确定 的 。 当 main 函 数 执行 完毕 或 调用 exit 函 数 时 (此 时 程序 终止 ) ， 调 用 析 构 函数 。 
(2) 如 果 定 义 的 是 局 部 自动 对 象 (如 在 函数 中 定义 对 象 ) ， 则 在 建立 对 象 时 调用 其 构造 函数 。 如 果 函 数 被 多 次 调用 ， 则 在 每 次 建立 对 象 时 都 要 调用 构造 函数 。 在 函数 调用 结束 、 对 象 释放 时 先 调用 析 构 
(3) 如 果 在 函数 中 定义 静态 (static) 局 部 对 象 ， 则 只 在 程序 第 一 次 调用 此 函数 建立 对 象 时 调用 构造 函数 一 次 ， 在 调用 结束 时 对 象 并 不 释放 ， 因 此 也 不 调用 析 构 函数 ， 只 在 main 函 数 结 束 或 调用 exit 函 
数 结束 程序 时 ， 才 调用 析 构 函数 。 例 如 ， 在 一 个 函数 中 定义 了 以 下 两 个 对 象 : 
void func (){ 
Box boxl; // 定义 自动 局 部 对 象 
static Box box2; // 定义 静态 局 部 对 象 
) 
在 调用 func 函 数 时 ， 先 调用 box1 的 构造 函数 ， 再 调用 box2 的 构造 函数 。 在 func 调 用 结束 时 ，box1 是 要 释放 的 (因为 它 是 自动 局 部 对 象 ) ， 因 此 要 调用 box1 的 析 构 函数 。 而 box2 是 静态 局 部 对 象 ， 在 
func 调 用 结束 时 并 不 需要 释放 ， 因 此 不 需要 调用 stud2 的 析 构 函数 ， 直 到 程序 结束 释放 stud2 时 ， 才 调用 stud2 的 析 构 函数 。 由 此 可 以 看 到 ，stud2 是 后 调用 构造 函数 的 ， 但 并 不 先 调 用 其 析 构 函数 ， 原 因 是 两 












































个 对 象 的 存储 类 别 、 生 命 周期 都 不 同 。 


2.2 ”继承 与 派生 


1. 继 承 与 派生 的 一 般 形 式 














继承 与 派生 在 C++ 中 也 是 经 常 使 有 








的 ， 比 如 设计 一 个 箱子 类 可 以 上 








以 下 代码 实现 : 















































Class CBox[( 
public: 
int volume (){ 
return height*width*length; 
} 
void display(){ 
cout««height««endl; 
cout««width««endl; 
cout««length««endl; 
} 
private: 
int height, width, length; 
H 











但 假设 现在 有 一 批 箱子 比较 特殊 ， 有 不 同 的 颜色 ， 且 局 


Class CBox new{ 
public: ~ 
int volume (){ 
return height*width*length; 


} 

void display (){ 
cout««height««endl; 
cout««width««endl; 
cout««length««endl; 
cout««color««endl; 
cout««weight««endl; 

} 

private: 
int height, width, length; 
int color,weight; 


H 


EE. 
BE 


也 都 不 一 样 ， 此 时 可 以 是 





新 声明 一 个 新 的 箱子 的 类 ， 如 下 所 示 : 








可 以 看 到 上 





Class CBox new::public CBox{ 
public: ` 
void displayl( { 
cout««color««endl; 
cout««weight««endl; 
} 
private: 
int color, weight; 


H 











面 的 程序 中 有 相当 一 部 分 是 原来 就 已 经 有 的 ， 其 


// 新 增加 的 成 员 函 数 





实 可 以 利 








原来 的 CBox 类 作为 基础 ， 


// 类 CBox new 继 承 于 类 CBox 


// 新 增加 的 成 员 变 量 





这 里 ，Box_new 就 是 一 个 派生 类 。 可 见 ， 











BAJRA 


类 的 一 般 形式 为 : 





class 派生 类 名 : [继承 方式 ] 
派生 类 新 增加 的 成 员 
HN 


基 类 名 { 








派生 类 里 有 两 大 部 分 内 容 : 从 基 类 继承 而 来 的 和 在 声明 派生 类 时 增加 的 部 分 。 派 生 类 中 接受 了 基 类 的 全 部 内 容 ， 这 样 可 能 出 现 有 些 基 类 的 成 员 ， 在 派生 类 中 是 
届 的 元 余 ， 尤 其 多 次 派生 后 ， 会 在 许多 派生 类 对 象 中 存在 大 量 无 
BAREK, (ENRERE. 





这 就 会 造成 数 











因此 ， 实 际 开发 中 要 根 拉 





居 派 生 类 的 需要 愤 是 





2. 派 生 类 的 访问 





属性 


(1) 派生 类 中 包含 基 类 成 员 和 派生 类 
成 员 直接 作为 派生 类 的 公 















































1) 基 类 的 成 员 函 数 只 能 访问 基 类 的 成 员 ， 而 不 能 访 




















2) 派生 类 的 成 员 函 数 可 以 访问 基 类 的 成 员 ， 具体 见 后 面 详细 描述 ; 派生 类 的 成 员 函 数 也 可 以 访 ii 
3) 在 派生 类 外 可 以 访问 基 类 的 成 员 ， 具体 见 后 面 详细 描述 ， 在 派生 类 外 也 可 以 访问 派生 类 的 公 























(2) 派生 类 的 成 员 函 数 访问 基 类 的 
类 的 继承 方式 ， 根 据 这 两 个 
































自己 增加 的 成 员 ， 就 产生 了 这 两 部 分 成 员 的 关系 和 访问 
成 员 ; 实际 上 ， 对 基 类 成 员 和 派生 类 























的 数据 ， 不 仅 浪费 了 











属性 的 问题 。 在 建立 派生 类 的 时 候 ， 并 不 是 简 和 








再 加 上 新 的 内 容 即 可 ， 如 下 所 示 : 


其 中 的 继承 方式 包括 public (公用 的 ) 、private (私有 的 ) 和 protected ( 受 保护 的 ) ， 此 项 是 可 选 的 ， 如 果 不 写 此 项 ， 则 默认 为 private (私有 的 ) 。 























不 到 的 ， 但 是 也 必须 继承 过 来 的 情况 。 
大 量 的 空间 ， 而 且 在 对 象 的 建立 、 赋 值 、 复 制 和 参数 的 传递 中 ， 花 费 许多 无 谓 的 时 间 ， 从 而 降低 了 效 








地 把 基 类 的 私有 成 员 直 接 作为 派生 类 的 私有 成 员 ， 把 基 类 的 











自己 增加 的 成 员 是 按 不 同 的 原则 





问 派生 类 的 成 员 。 








处 理 的 。 





人体 来 说 ， 在 讨论 访问 属性 时 ， 要 考虑 以 下 几 种 情况 。 


派生 类 成 员 。 














成 员 和 在 派生 类 外 访问 基 类 的 成 员 涉 及 如 何 确定 基 类 的 成 员 在 派生 类 中 的 访问 
因素 共同 决定 基 类 成 员 在 派生 类 中 的 访问 





成 员 ， 而 不 能 访问 派生 类 的 私有 成 员 。 








属性 的 问题 ， 不 仅 要 考虑 对 基 类 成 员 所 声明 的 访问 





属性 ， 还 要 考虑 派生 类 所 声明 的 对 基 


属性 。 在 派生 类 中 ， 对 基 类 的 继承 方式 可 以 有 public (公用 的 ) 、private (私有 的 ) 和 protected (保护 的 ) 3 种 。 不 同 的 继承 方式 决定 





了 基 类 成 员 在 派生 类 中 的 访问 属性 。 简 单 地 说 可 以 总 结 为 以 下 几 点 。 
1) 公用 继承 (public inheritance) : H94 


























2) 私有 继承 (private inheritance) : 基 类 的 公用 成 员 和 


成 员 和 保护 成 员 在 派生 类 中 保持 原 有 访问 





属性 














， 其 私有 成 员 仍 为 基 类 私有 。 




















保护 成 员 在 派生 类 中 成 了 私有 成 员 ， 








3) 受 保护 的 继承 (protected inheritance) : 基 类 的 公 











在 多 级 派生 的 情况 下 ， 各 成 员 的 访问 














类 ; 类 A 是 类 B 的 直接 基 类 ， 是 类 C 的 间接 基 类 。 派 生 关系 如 








成 员 和 保护 成 员 在 派生 类 中 成 了 保护 成 员 ， 其 私有 成 员 仍 为 基 类 私有 。 保 护 成 员 的 意思 是 ， 不 能 被 外 界 引 


其 私有 成 员 仍 为 基 类 私有 。 


























， 但 可 以 被 派生 类 的 成 员 引 

















属性 仍 按 以 上 原则 确定 。 假 设 类 A 为 基 类 ， 类 B 是 类 A 的 派生 类 ， 类 C 是 类 B 的 派生 类 ， 则 类 C 也 是 类 A 的 派生 类 ;类 B 称 为 类 A 的 直接 派生 类 ， 类 C 称 为 类 A 的 间接 派生 
2-3 所 示 。 





如 果 声 明了 以 下 的 类 : 


class A( 
public: 

int var A pub; 
protected: ^ 

void func A pro(); 

int var A pro; 
private: 

int var A pri; 
HN 
class B:public Ai 
public: 

void func B pub(); 
protect: m 

void func B pro(); 
private: ub 

int var B pri; 
HN 
class C:protected B( 
public: 

void func C pub(); 
private: 

int var C pri; 


HN 





图 2-3 ”类 A、 类 B 和 类 C 的 派生 关系 








则 类 A 是 类 B 的 公用 基 类 ， 类 B 是 类 (C 的 保护 基 类 。 各 成 员 在 不 同类 中 的 访问 属性 如 表 2-1 所 示 。 


表 2-1 派生 的 各 个 成 员 的 访问 属性 


var A | func A var A | var A |func B |func B | var B |func C. 
pub pro pri pub pro pri pub 
: | | 
m 


pro 
ER | | 
保护 访问 


公用 于 和 关公 用 ”| 保护 | 保护 | 不 可 访问 | 公用 | MP [E | | 
和 类 


通过 以 上 分 析 ， 可 以 看 到 : 无 论 哪 一 种 继承 方式 ， 在 派生 类 中 是 不 能 访问 基 类 的 私有 成 员 的 ， 私 有 成 员 只 能 被 本 类 的 成 员 函 数 所 访问 ， 毕 竟 派 生 类 与 基 类 不 是 同一 个 类 。 如 果 在 多 级 派生 时 都 采用 公 
继承 方式 ， 那 么 直到 最 后 一 级 派生 类 都 能 访问 基 类 的 公用 成 员 和 保护 成 员 。 如 果 采 用 私有 继承 方式 ， 经 过 若干 次 派生 之 后 ， 基 类 的 所 有 成 员 就 会 变 成 不 可 访问 的 了 。 如 果 采 用 保护 继承 方式 ， 在 派生 类 外 是 
无 法 访问 派生 类 中 的 任何 成 员 的 ; 而 且 经 过 多 次 派生 后 ， 人 们 很 难 清楚 地 记 住 哪些 成 员 可 以 访问 ， 哪 些 成 员 不 能 访问 ， 很 容易 出 错 。 因 此 ， 在 实际 中 ， 常 用 的 是 公用 继承 。 
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3 派生 类 的 构造 函数 与 析 构 函数 

派生 类 的 数据 成 员 由 所 有 基 类 的 数据 成 员 与 派生 类 新 增 的 数据 成 员 共同 组 成 ， 如 果 派 生 类 新 增 成 员 中 包括 其 他 类 的 对 象 ( 子 对 象 ) ， 派 生 类 的 数据 成 员 中 实际 上 还 间接 地 包括 了 这 些 对 象 的 数据 成 员 。 
因此 ， 构 造 派生 类 的 对 象 时 ， 必 须 对 基 类 数据 成 员 、 新 增 数 据 成 员 和 成 员 对 象 的 数据 成 员 进 行 初始 化 。 派 生 类 的 构造 函数 必须 要 以 合适 的 初 值 作为 参数 ， 隐 含 调用 基 类 和 新 增 对 象 成 员 的 构造 函数 ， 来 初始 
化 它们 各 自 的 数据 成 员 ， 然 后 再 加 入 新 的 语句 对 新 增 普通 数据 成 员 进行 初始 化 。 
































派生 类 构造 函数 的 一 般 格 式 如 下 : 





< 派生 类 名 >: :< 派生 类 名 > (< 参数 表 >) : < 基 类 名 1> (< 参数 表 1>) ，……… ， 
< 基 类 名 n> (< 参数 表 n>) ， 
< 子 对 象 名 1> (< 参数 表 n+1>) ，……… , 
FA S Em (< 参数 表 nHm>) ( 
< 派生 类 构造 函数 体 > // 派生 类 新 增 成 员 的 初始 化 
} 





对 派生 类 的 构造 函数 有 以 下 几 点 说 明 : 


(1) 对 基 类 成 员 和 子 对 象 成 员 的 初始 化 必须 在 成 员 初 始 化 列表 中 进行 ， 新 增 成 员 的 初始 化 既 可 以 在 成 员 初始 化 列表 中 进行 ， 也 可 以 在 构造 函数 体 中 进行 。 















































(2) 派生 类 构造 函数 必须 对 这 3 类 成 员 进 行 初始 化 ， 其 执行 顺序 是 这 样 的 : @ 先 调用 基 类 构造 函数 ; @ 再 调用 子 对 象 的 构造 函数 ; @@ 最 后 调用 派生 类 的 构造 函数 体 。 




















(3) 当 派 生 类 有 多 个 基 类 时 ， 处 于 同一 层次 的 各 个 基 类 的 构造 函数 的 调用 顺序 取决 于 定义 派生 类 时 声明 的 顺序 ( 自 左 向 右 ) ， 而 与 在 派生 类 构造 函数 的 成 员 初始 化 列表 中 给 出 的 顺序 无 关 。 














(4) 如 果 派 生 类 的 基 类 也 是 一 个 派生 类 ， 则 每 个 派生 类 只 需 负责 其 直接 基 类 的 构造 ， 依 次 上 漳 。 











(5) 当 派 生 类 中 有 多 个 子 对 象 时 ， 各 个 子 对 象 构造 函数 的 调用 顺序 也 取决 于 在 派生 类 中 定义 的 顺序 (自前 至 后 ) ， 而 与 在 派生 类 构造 函数 的 成 员 初 始 化 列表 中 给 出 的 顺序 无 关 。 





























(6) 派生 类 构造 函数 提供 了 将 参数 传递 给 基 类 构造 函数 的 途径 ， 以 保证 在 基 类 进行 初始 化 时 能 够 获得 必要 的 数据 。 因 此 ， 如 果 基 类 的 构造 函数 定义 了 一 个 或 多 个 参数 时 ， 派 生 类 必须 定义 构造 函数 。 























(7) 如 果 基 类 中 定义 了 默认 构造 函数 或 根本 没有 定义 任何 一 个 构造 函数 (此 时 由 编译 器 自动 生成 默认 构造 函数 ) 时 ， 在 派生 类 构造 函数 的 定义 中 可 以 省 略 对 基 类 构造 函数 的 调用 ， 即 省 略 "< 基 类 名 
> (< 参数 表 > ) “这 个 语句 。 








(8) 子 对 象 的 情况 与 基 类 相同 。 


(9) 当 所 有 的 基 类 和 子 对 象 的 构造 函数 都 可 以 省 略 时 ， 可 以 省 略 派生 类 构造 函数 的 成 员 初始 化 列表 。 

















(10) 如 果 所 有 的 基 类 和 子 对 象 构造 函数 都 不 需要 参数 ， 派 生 类 也 不 需要 参数 时 ， 派 生 类 构造 函数 可 以 不 定义 。 派 生 类 构造 函数 的 使 用 可 以 参考 例 2.26 的 程序 。 











【 例 2.26】 派生 类 构造 函数 的 使 用 举例 。 

















#include<iostream> 


#include<string> 
using namespace std; 
class CStudent{ // 声明 基 类 Student 
public: 
CStudent (int n,string nam,char s){ // 基 类 构造 函数 
num-n; 
name-nam 
sex-s 
} 
^CStudent () {} // 基 类 析 构 函数 
protected: // 保护 部 分 
int num; 
string name; 
char sex ; 
HN 
class CStudentl: public CStudent( // 声明 派生 类 Student1 
Public : // 派生 类 的 公用 部 分 


CStudentl (int n,string narm char s,int a,string ad): CStudent (n,nam,s)( 
// 派生 类 构造 函数 
age-a; // 在 函数 体 中 只 对 派生 类 新 增 的 数据 成 员 初 始 化 
addr-ad; 


void show(){ 
cout««"num: "««num««endl; 
cout««"name: "««name««endl; 
Cout<<"sex: "«Xsex««endl; 
cout««"age: "««age««endl; 
cout««"address: "««addr««endl««endl; 


F 

~CStudent1 (){ } // 派生 类 析 构 函数 
private : // 派生 类 的 私有 部 分 

int age; 

string addr; 


H 

int main()( 
CStudentl studl (10010,"Wang-li",'f',19,"115 Beijing Road, Shanghai"); 
CStudentl stud2 (10011,"Zhang-fun", 'm',21,"213 Shanghai Road,Beijing"); 
studl.show(); // 输出 第 一 个 学 生 的 数据 
1 // 输出 第 二 个 学 生 的 数据 


return 0; 





程序 的 执行 结果 是 : 





num: 10010 

name: Wang-li 

sex: f 

age: 19 

address: 115 Beijing Road, Shanghai 
num: 10011 

name: Zhang-fun 

sex: m 

age: 21 

address: 213 Shanghai Road,Beijing 











例 2.26 中 定义 了 类 CStudent、 类 CStudent1， 其 中 类 CStudent1 继 承 了 类 CStudent。 类 CStudent1 比 基 类 新 增 了 两 个 数据 成 员 。 基 类 CStudent 有 自己 的 带 参 构 造 函 数 ， 而 派生 类 的 构造 函数 ， 则 只 须 
对 派生 类 新 增 的 数据 成 员 初 始 化 ， 不 过 需要 把 基 类 的 参数 也 给 带 进 去 。 



































析 构 函数 的 作用 是 在 对 象 撤销 之 前 ， 进 行 必要 的 清理 工作 。 当 对 象 被 删除 时 ， 系 统 会 自动 调用 析 构 函数 。 



































ES 


析 构 函数 比 构造 函数 简单 ， 没 有 类 型 ， 也 没有 参数 。 在 派生 时 ， 派 生 类 是 不 能 继承 基 类 的 析 构 函数 的 ， 也 需要 通过 派生 类 的 析 构 函数 去 调用 基 类 的 析 构 函数 。 在 派生 类 中 可 以 根据 需要 定义 自己 的 析 构 
函数 ， 用 来 对 派生 类 中 所 增加 的 成 员 进 行 清理 工作 ; 基 类 的 清理 工作 仍然 由 基 类 的 析 构 函数 负责 。 在 执行 派生 类 的 析 构 函数 时 ， 系 统 会 自动 调用 基 类 的 析 构 函 数 和 子 对 象 的 析 构 函数 ， 对 基 类 和 子 对 象 进行 
清理 。 
































ES 
































4 .派生 类 的 构造 函数 与 析 构 函数 的 调用 顺序 






































前 面 已 经 提 到 ， 构 造 函 数 和 析 构 函数 的 调用 顺序 是 先 构造 的 后 析 构 ， 后 构造 的 先 析 构 。 那 么 基 类 和 派生 类 中 的 构造 函数 和 析 构 函数 的 调用 顺序 是 否 也 是 如 此 呢 ? 

















构造 函数 的 调用 顺序 规则 如 下 所 述 。 























1) 基 类 构造 函数 。 如 果 有 多 个 基 类 ， 则 构造 函数 的 调用 顺序 是 某 类 在 类 派生 表 中 出 现 的 顺序 ， 而 不 是 它们 在 成 员 初始 化 表 中 的 顺序 。 

















2) 成 员 类 对 象 构造 函数 。 如 果 有 多 个 成 员 类 对 象 ， 则 构造 函数 的 调用 顺序 是 对 象 在 类 中 被 声明 的 顺序 ， 而 不 是 它们 出 现在 成 员 初始 化 表 中 的 顺序 。 








Ww 





































































































而 析 构 函数 的 调用 顺序 与 构造 函数 的 调用 顺序 正好 相反 ， 将 上 面 3 点 内 容 中 的 顺序 反 过 来 用 就 可 以 了 ， 即 : 首先 调用 派生 类 的 析 构 函数 ;其 次 再 调用 成 员 类 对 象 的 析 构 函数 ; 最 后 调用 基 类 的 析 构 函 数 。 
析 构 函数 在 下 面 3 种 情况 时 被 调用 。 



































A 


对 象 生命 周 期 结束 被 销毁 时 (一般 类 成 员 的 指针 变量 与 引用 都 不 自动 调用 析 构 函数 ) 。 


























2) delete 指 向 对 象 的 指针 时 ， 或 delete 指 向 对 象 的 基 类 类 型 指针 ， 而 其 基 类 虚构 函数 是 虚 函 数 时 。 




















Ww 


对 象 是 对 象 o 的 成 员 ，o 的 析 构 函数 被 调用 时 ， 对 象 的 析 构 函数 也 被 调用 。 












































下 面 用 例 2.27 来 说 明 构造 函数 的 调用 顺序 。 


























【 例 2.27】 ”构造 函数 的 调用 顺序 。 








#include<iostream> 
using namespace std; 
class CBase( 
public: 
CBase (){ std::cout««"CBase: :CBase () "««std::endl; } 
^ CBase (){ std::cout««"CBase: :^CBase () "««std::endl; } 
H 
class CBasel:public CBase { 


public: 
CBasel ()( std::cout««"CBase: :Basel () "««std::endl; ) 
~ CBasel ()( std::cout««"CBase: : «Basel ()"««std::endl; } 


H 
class CDerive{ 
public: 
CDerive (){ std::cout««"CDerive::CDerive()"«€std::endl; } 
~ CDerive (){ std::cout<<"CDerive::~CDerive()"<<std::endl; } 
HN 
class CDerivel:public CBasel( 


private: 
CDerive m derive; 
public: 
CDerivel () { std::cout««"CDerivel::CDerivel()"««std::endl; } 


~CDerivel () { std::cout««"CDerivel::-CDerivel()"««std::endl; } 
HN 
int main(){ 

CDerivel derive; 

return 0; 


) 
程序 的 执行 结果 是 : 


CBase: :CBase () 
CBase: : Basel () 
CDerive::CDerive () 
CDerivel::CDerivel() 





::~Basel () 
CBase: :~CBase () 




















例 2.27 中 声明 了 4 个 类 ，CBase1 继 承 于 CBase、CDerive1 继 承 于 CBase1、CDerive1 中 有 CDerive 的 成 员 变 量 ， 最 后 定义 一 个 CDerive1 对 象 ， 用 来 确定 各 种 基 类 、 派 生 类 的 构造 函数 和 析 构 函数 的 执行 
顺序 。 执 行 结果 与 上 文中 描述 的 调用 顺序 相符 。 















































总 的 来 说， 构造 函数 的 调用 顺序 是 : @ 如 果 存 在 基 类 ， 那 么 先 调用 基 类 的 构造 函数 ， 如 果 基 类 的 构造 函数 中 仍然 存在 基 类 ， 那 么 程序 会 继续 进行 向 上 查找 ， 直 到 找到 它 最 早 的 基 类 进行 初始 化 〈 如 上 例 
中 类 Derive1， 继 承 于 类 Base 与 Base1) ; @ 如 果 所 调用 的 类 中 定义 的 时 候 存在 对 象 被 声明 ， 那 么 在 基 类 的 构造 函数 调用 完成 以 后 ， 再 调用 对 象 的 构造 函数 (如 上 例 在 类 Derive1 中 声明 的 对 象 Derive 
m derive) ; @ 调 用 派生 类 的 构造 函数 (如 上 例 最 后 调用 的 是 Derive1 类 的 构造 函数 ) 。 














































































































2.3 ”类 的 多 态 


1. 多 态 























多 态 ， 顾 名 思 义 ， 是 一 个 事物 有 多 种 形态 的 意思 。 在 C+ + 程序 设计 中 ， 多 态 性 是 指 具 有 不 同 功能 的 函数 可 以 用 同一 个 函数 名 ， 这 样 就 可 以 用 一 个 函数 名 调用 不 同 内 容 的 函数 。 在 面向 对 象 方法 中 一 般 是 
这 样 表述 多 态 性 的 : 向 不 同 的 对 象 发 送 同一 个 消息 ， 不 同 的 对 象 在 接收 时 会 产生 不 同 的 行为 〈 即 方法 ) ; 也 就 是 说 ， 每 个 对 象 可 以 用 自己 的 方式 去 响应 共同 的 消息 。 所 谓 消息 ， 就 是 调用 函数 ， 不 同 的 行为 
就 是 指 不 同 的 实现 ， 即 执行 不 同 的 函数 。 



























































[512.28] ” 基 类 和 派生 类 成 员 函 数 同 名 覆盖 时 的 执行 选择 。 





#include<iostream> 
using namespace std; 
class A{ 
public: 
AQ 
virtual void foo(){ 
cout««"This is A."««endl; 


class B : public A( 


void foo(){ 


b.foo(); 
return 0; 





程序 的 执行 结果 : 








This is A. 
This is B. 





例 2.28 中 声明 了 两 个 类 (类 A 和 类 B) ， 注 意 类 A 中 的 foo 函 数 和 类 B 中 的 foo 函 数 不 是 重 载 函数 ， 它 们 不 仅 函 数 名 相同 ， 而 且 函 数 类 型 和 参数 个 数 都 相同 ， 但 两 个 同名 函数 不 在 同一 个 类 中 ， 而 是 分 别 在 
基 类 和 派生 类 中 ， 属 于 同名 覆盖 。 若 是 重 载 函数 ， 二 者 的 参数 个 数 和 参数 类 型 必须 至 少 有 一 者 不 同 ， 否 则 系统 无 法 确定 调用 哪 一 个 函数 。 而 此 处 定义 了 一 个 A 类 的 对 象 3 和 B 类 的 对 象 b， 有 所 区 别 ， 所 以 会 分 
别 执行 各 个 类 的 foo 函 数 。 




































































人 们 提出 这 样 的 设想 ， 能 否 用 同一 个 调用 形式 ， 既 能 调用 派生 类 又 能 调用 基 类 的 同名 函数 。 在 程序 中 不 是 通过 不 同 的 对 象 名 去 调用 不 同 派生 层次 中 的 同名 函数 ， 而 是 通过 指针 调用 它们 。C++ 中 的 虚 函 
数 就 是 用 来 解决 这 个 问题 的 。 虚 函数 的 作用 是 允许 在 派生 类 中 重新 定义 与 基 类 同名 的 函数 ， 并 且 可 以 通过 基 类 指针 或 引用 来 访问 基 类 和 派生 类 中 的 同名 函数 。 






















































































再 看 下 面 的 例 2.29， 基 类 和 派生 类 中 有 同名 的 函数 display， 就 是 使 用 虚 函 数 ， 使 得 基 类 指针 可 以 访问 派生 类 中 的 同名 函数 。 








uU 























[£2.29] ”使 用 虚 函 数 可 以 使 得 基 类 指针 访问 派生 类 中 的 同名 函数 。 








#include <iostream> 
#include <string> 
using namespace std; 


/* 声 明基 类 Box*/ 
class Box( 
public: 
Box(int,int,int); // 声明 构造 函数 
virtual void display(); // 声明 输出 函数 
protected: // 受 保护 成 员 ， 派 生 类 可 以 访问 


int length, height, width; 


HN 
/ *Box X k, ji i 469 3c 3L / 


Box:: Box (int l,int h,int w){ // 定义 构造 函数 
length -1; 
height -h; 
width =w; 

} 

void Box: :display () { // 定义 输出 函数 


cout««"length:" << length ««endl; 
cout««"height:" << height ««endl; 
cout««"width:" << width ««endl; 


} 
/* 声 明 公 用 派生 类 FilledBox*/ 
class FilledBox : public Box( 


public: 
FilledBox (int, int, int, int, string); // 声明 构造 函数 
virtual void display(); 虚 函 数 
private: 
int weight; // 重量 
string fruit; // 装着 的 水 果 


H 
/* FilledBox 类 成 员 函 数 的 实现 */ 
void FilledBox :: display(){ // 定义 输出 函数 
cout««"length:"«« length ««endl; 
cout««"height:"«« height ««endl; 
cout««"width:"«« width ««endl; 
cout««"weight:"«« weight ««endl; 
cout««"fruit:"«« fruit ««endl; 
} 
FilledBox:: FilledBox (int l, int h, int w, int we, string f ) : Box(l,h,w), weight (we), 
fruit (f) {} 
int main(){ // 主 函 数 
Box box(1,2,3); // € XStudent X3] $.studl 
FilledBox fbox(2,3,4,5,"apple"); // 定义 FilledBox 类 对 象 fbox 
Box *pt = &box; // 定义 指向 基 类 对 象 的 指针 变量 pt 
pt->display( ); 
pt = &fbox; 
pt->display( ); 
return 0; 





程序 的 执行 结果 是 : 





length:1 
height:2 
width:3 
length:2 
height:3 
width:4 
weight:5 
fruit:apple 





例 2.25 中 声明 了 一 个 类 Box 和 一 个 继承 于 类 Box 的 类 FilledBox。 类 Box 中 有 一 个 成 员 函 数 display， 类 FilledBox 中 也 有 一 个 成 员 函 数 display， 现 在 将 基 类 Box 中 的 成 员 函 数 display 定 义 为 虚 函 数 ， 就 能 使 
基 类 对 象 的 指针 变量 既 可 以 访问 基 类 的 成 员 函 数 display， 也 可 以 访问 派生 类 的 成 员 函 数 display。 


qi 











例 2.25 就 展现 了 虚 函 数 的 奇妙 作 














同一 种 调 

















说 明 : 本 来 基 类 指针 是 
果 基 类 中 的 display 函 数 不 是 虚 函 数 ， 是 无 法 通过 基 类 指针 去 调 




















。 现 在 
































来 指向 基 类 对 象 的 ， 如 果 








针 指 向 派生 类 对 象 





当 把 基 类 的 某 个 成 员 函 数 声明 为 虚 函 数 后 ， 就 允许 在 其 派生 类 中 对 该 函数 和 


c, 














虚 函 数 时 就 调 





























了 派生 类 的 虚 函 数 。 












































同一 个 指针 变量 (指向 基 类 对 象 的 指针 变量 
形式 "pt->display () "， 而 且 pt 是 同一 个 基 类 指针 ， 也 可 以 调用 同一 类 族 中 不 同类 的 虚 函 数 。 这 就 是 多 态 性 ， 即 对 同一 消息 ， 不 同 对 象 有 不 同 的 响应 方式 。 














， 不 但 输出 了 box 的 全 部 数据 ， 而 且 还 输出 了 fbox 的 全 部 数据 ， 这 就 说 明 已 调 








了 fbox 的 display 函 数 。 这 表明 





它 指 向 派生 类 对 象 ， 则 需要 进行 指针 类 型 转换 ， 即 将 派生 类 对 象 的 指针 先 转换 为 基 类 的 指针 ， 所 以 基 类 指针 指向 的 是 派生 类 对 象 中 的 基 类 部 分 。 如 
派生 类 对 象 中 的 成 员 函 数 的 。 虚 函数 突破 了 这 一 限制 ， 在 派生 类 的 基 类 部 分 中 ， 

















派生 类 的 虚 函 数 取代 了 基 类 原来 的 虚 函 数 ， 因 此 在 使 基 类 指 





















































virtual 声 明了 虚 函 数 后 才 具 有 以 上 作 























实现 了 同一 类 族 中 不 同类 的 对 象 可 以 对 同一 函数 调 








虚 函 数 的 使 























在 基 类 





(1 





这 样 就 可 以 在 派生 类 中 和 





(2 





方法 如 下 所 述 。 


virtual 关 键 字 声 明成 员 函 数 为 虚 




















新 定义 此 函数 ， 为 它 赋予 新 的 功能 ， 


函数 。 


注意 的 是 ， 只 : 


并 能 方便 地 被 调 











， 如 果 不 声明 为 虚 函 数 ， 企 图 通过 基 类 指针 调用 派生 类 的 非 虚 函 数 则 是 不 行 的 。 



























































新 定义 ， 赋 予 它 新 的 功能 ， 并 且 可 以 通过 指向 基 类 的 指针 指向 同一 类 族 中 不 同类 的 对 象 ， 从 而 调 








其 中 的 同名 函数 。 虚 函数 


可 


作出 不 同 的 响应 的 动态 多 态 性 。 














。 在 类 外 定义 虚 函 数 时 ， 不 必 再 加 virtual 关 键 字 。 








在 派生 类 中 重新 定义 此 函数 ， 要 求 函 数 名 、 函 数 类 型 、 函 数 参数 个 数 和 类 型 全 部 与 基 类 的 虚 函 数 相同 ， 并 根据 派生 类 的 需要 重新 定义 函数 体 。 




















C++ 规定 ， 当 一 个 成 员 函 数 被 声明 为 虚 函 数 后 ， 其 派生 类 中 的 同名 函数 都 


都 加 virtual 关 键 字 ， 使 程序 更 加 清晰 。 如 果 在 派生 类 中 没有 对 : 


(3) 定义 一 个 指向 基 类 对 象 的 指针 变量 ， 

















动 成 为 虚 函 数 。 因 此 在 派生 类 重新 声明 该 虚 函 数 时 ， 可 以 加 virtual 关 键 字 ， 也 可 以 不 加 ， 但 一 般 习 惯 在 每 一 层 声明 该 函数 时 











ES 














基 类 的 虚 函 数 重新 定义 ， 则 派生 类 简单 地 继承 其 











并 使 它 指向 同一 类 族 中 需 





调 





























通过 该 指针 变量 调 


(4) 通过 虚 函 数 与 指向 基 类 对 象 的 指针 变量 的 配合 使 








此 虚 函 数 ， 此 时 调 




















， 就 能 方便 地 调 


























直接 基 类 的 虚 图 数 。 


ES 








该 函数 的 对 象 。 


的 就 是 指针 变量 指向 的 对 象 的 同名 函数 。 


























同一 类 族 中 不 同类 的 同名 函数 ， 只 : 











基 类 指针 指向 即 可 。 如 果 指 针 不 断 地 指向 同一 类 族 中 不 同类 的 对 象 ， 就 能 不 断 地 调 











这 些 对 象 中 的 同名 函数 。 正 如 前 面 所 说 ， 不 断 地 告诉 出 租车 司机 要 去 的 目的 地 ， 然 后 司机 把 你 送 到 你 要 去 的 地 方 。 


需要 说 明 以 下 几 点 : @ 有 时 在 基 类 中 定义 的 非 虚 函 数 会 在 派生 类 中 被 
派生 类 对 象 中 的 成 员 函 数 ， 这 并 不 是 多 态 性 行为 (使 








系统 会 调 




















2. 虚 函数 的 使 



































2) 一 个 成 员 函 数 被 声明 为 虚 函 数 
(2) 根据 什么 考虑 是 否 把 一 个 成 员 函 数 声明 为 虚 函 数 呢 ? 3 


1) 首先 看 成 员 函 数 所 在 的 类 是 否 会 作为 基 类 。 然 后 看 成 员 函 数 在 类 的 继承 




















2) 如 果 成 员 函 数 在 类 被 继承 


3) 应 考虑 对 成 员 函 





后 的 功能 不 需 














数 的 调 











被 修改 ， 或 派生 类 


是 通过 对 象 名 还 是 通过 基 类 指针 或 引 












































新 定义 ， 如 果 
的 是 不 同类 型 的 指针 ) ， 没 有 


























派生 类 指针 调 











基 类 指针 调用 该 成 员 函 数 ， 则 系统 会 调 
到 虚 函 数 的 功能 。 











对 象 中 基 类 部 分 的 成 员 函 数 ; @ 如 果 














该 成 员 函 数 ， 则 






































虚 函 数 时 ， 有 两 点 要 注意 ， 如 下 所 述 。 





virtual 关 键 字 声明 类 的 成 员 函 数 ， 使 它 成 为 虚 函 数 ， 而 不 能 将 类 外 的 普通 函数 声明 为 虚 函 数 。 因 为 虚 函 数 的 作 有 


后 ， 在 同一 类 族 中 的 类 就 不 能 再 定义 一 个 非 virtual 的 但 与 该 虚 函 数 























于 类 的 继承 层次 














是 允许 在 派生 类 中 对 基 类 的 虚 函 数 重新 定义 。 显 然 ， 它 只 能 









































有 相同 的 参数 (包括 个 数 和 类 型 ) 和 函数 返回 值 类 型 的 同名 函数 。 














不 到 该 函 











于 有 无 可 能 被 更 改 功能 ， 如 果 希 望 更 改 其 功能 ， 一 般 应 该 将 它 声明 为 虚 函 数 。 








数 ， 则 不 要 把 它 声明 为 虚 函 数 。 不 要 仅仅 考虑 到 要 作为 基 类 而 把 类 中 的 所 有 成 员 函 数 都 声明 为 虚 函 数 。 



































4) 有 时 ， 在 定义 虚 函 数 时 并 不 定义 其 函数 体 ， 即 函数 体 是 空 的 。 它 的 作 














需要 说 明 的 是 : 使 
的 时 间 开 销 是 很 少 的 ， 





3. 纯 虚 函 数 








去 访 i 


J 





， 如 果 是 通过 基 类 指针 或 引 





去 访问 的 ， 则 应 当 声 明 为 虚 函 数 。 























虚 函 数 ， 系 统 要 有 一 定 的 空间 开销 。 当 一 个 类 带 有 虚 函 数 时 ， 编 译 系统 会 为 该 类 构造 一 个 虚 函 数 表 ， 它 是 一 个 指针 数组 ， 
因此 ， 多 态 是 高 效 的 。 





只 是 定义 了 一 个 虚 函 数 名 ， 具 体 功能 留 给 派生 类 去 添加 。 




















于 存放 每 个 虚 函 数 的 入 口 地 址 。 系 统 在 进行 动态 关联 时 














纯 虚 函数 是 在 基 类 中 声明 的 虚 函 数 ， 它 在 基 类 中 没有 定义 ， 但 要 求 任何 派生 类 都 要 定义 自己 的 实现 方法 。 在 基 类 中 实现 纯 虚 函数 的 方法 是 在 函数 原型 后 加 “=0”， 如 下 所 示 : 


virtual void funtion()=07 


而 虚 函 数 的 定义 是 : 





virtual void funtion(); 








为 了 方便 使 








多 态 特性 ， 








常常 需要 在 基 类 中 定义 虚 函 数 。 但 在 很 多 情况 下 ， 




















动物 本 身 生 成 对 象 明显 不 





基 类 本 身 生 成 对 象 是 不 合 情 理 的 。 例 如 ， 动 物 作 为 一 个 基 类 可 以 派生 出 老虎 、 孔 省 等 子 类 , 但 








合 常理 。 为 了 解决 上 述 问题 ， 从 而 引入 了 纯 虚 函数 的 概念 ， 将 函数 定义 为 纯 虚 函数 ， 则 编译 器 要 求 在 派生 类 中 必须 予以 重 载 以 实现 多 态 性 。 同 时 含有 纯 虚 函数 的 类 称 为 抽象 类 ， 它 不 能 生成 对 象 。 如 果 一 个 


类 中 含有 纯 虚 函数 ， 那 么 任何 试图 对 该 类 进行 实例 化 的 语句 都 是 错误 的 ， 
的 定义 ， 不 然 编译 时 会 出 错 。 


[412.30] 


class Animail( 
public: 


virtual void GetColor() 


HN 
class Dog : 
public: 


virtual void GetColor() 


HN 
class Pig : 
public: 


virtual void GetColor() 


p 


int main (){ 


纯 虚 函 数 的 使 























举例 。 





= 0; 


public Animail( 


public Animail( 


Animail cAnimail; 


return 0; 


} 





{cout <<"Yellow"endl; }; 


(cout ««"White"««endl;); 


因为 抽 






































象 基 类 是 不 能 被 直接 调 





的 ， 而 必须 被 子 类 继承 重 载 以 后 ， 再 根据 要 求 调用 其 子 类 的 方法 ， 且 在 子 类 中 一 定 要 实现 纯 虚 函数 








该 程序 编译 失败 ， 因 为 在 例 2.30 中 声明 了 一 个 动物 类 (Animail) ， 类 中 有 一 函数 GetColor 可 取得 动物 颜色 ， 但 动物 有 很 多 很 多 种 ， 颜 色 自然 无 法 确定 ， 所 以 就 把 它 声明 为 纯 虚 函数 ， 也 就 是 只 声明 函 
数 名 不 去 定义 (实现 ) 它 ， 不 能 通过 编译 。 有 一 点 需要 注意 ， 纯 虚 函 数 不 能 实例 化 ， 但 可 以 声明 指针 ， 所 以 上 面 的 程序 编译 时 ， 编 译 器 会 告诉 你 : 由 于 它 的 成 员 的 原因 ， 无 法 抽象 类 Animail， 并 且 警 告 你 
GetColor () 没有 定义 ， 所 以 报错 。 











4. 析 构 函 数 
































在 C++ 中 ， 构 造 函 数 不 能 声明 时 为 虚 函 数 ， 这 是 因为 编译 器 在 构造 对 象 时 ， 必 须知 道 确切 类 型 ， 才 能 正确 地 生成 对 象 ; 其 次 ， 在 构造 函数 执行 之 前 ， 对 象 并 不 存在 ， 无 法 使 用 指向 此 对 象 的 指针 来 调 有 
构造 函数 。 然 而 ， 析 构 函 数 可 以 声明 为 虚 函 数 ; C++ 明确 指出 ， 当 derived class 对 象 经 由 一 个 base class 指 针 被 删除 、 而 该 base class 带 着 一 个 non-virtual 析 构 函 数 ， 会 导致 对 象 的 derived 成 分 没 被 销毁 
掉 ， 如 例 2.31 所 示 。 


























[012.31] 。 析 构 函数 不 是 虚 函 数 容易 引发 内 存 泄漏 。 





#include<iostream> 

using namespace std; 

class Base{ 

public: 
Base () { std: :cout<<"Base::Base () "<<std: :endl; } 
^Base()( std::cout««"Base: :-Base () "««std::endl; } 

F 

class Derive:public Base{ 


public: 
Derive (){ std::cout««"Derive::Derive()"««std::endl; } 
^Derive()( std::cout««"Derive::-Derive()"««std::endl; } 


H 
int main(){ 
Base* pBase - new Derive(); 
/* 这 种 base classed 的 设计 目的 是 为 了 用 来 “通过 base classiku 4p derived classi} $” */ 
delete pBase; 
return 0; 





程序 的 执行 结果 是 : 





Base: :Base() 
Derive::Derive|() 
Base: :-Base () 





例 2.31 中 声明 了 两 个 类 Base 和 类 Derive， 类 Derive 继 承 于 类 Base， 两 个 类 各 自 有 构造 函数 和 析 构 函数 ， 并 且 基 类 和 派生 类 的 析 构 函数 都 是 非 虚 函 数 。 从 上 面 的 执行 结果 可 以 看 出 ， 析 构 函 数 的 调用 结果 
是 存在 问题 的 ， 也 就 是 说 析 构 函数 只 做 了 局 部 销毁 工作 ， 这 可 能 形成 资源 泄漏 、 损 坏 数据 结构 等 问题 。 而 解决 此 问题 的 方法 很 简单 ， 只 要 给 基 类 一 个 virtual 析 构 函 数 即 可 ， 如 例 2.32 所 示 。 

















[012.32] 。 基 类 的 析 构 函数 为 虚 函 数 。 





#include<iostream> 
using namespace std; 
class Base{ 
public: 
Base (){ std::cout««"Base::Base () "««std::endl; } 
virtual ~Base(){ std::cout««"Base::-Base()"««std::endl; } 
H 
class Derive:public Base( 


public: 
Derive()( std::cout««"Derive: :Derive()"««std::endl; } 
^Derive()( std::cout««"Derive::-Derive()"««std::endl; } 


int main()( 

Base* pBase - new Derive(); 
delete pBase; 

return 0; 


Base: :Base () 
Derive::Derive|() 
Derive::-Derive() 
Base: :~Base () 





例 2.32 与 例 2.31 的 区 别 只 在 于 是 否 把 基 类 的 析 构 函数 声明 为 虚 函 数 。 例 2.32 中 派生 类 和 基 类 都 能 正常 析 构 了 ， 这 样 的 结果 正 是 我 们 所 希望 的 。 虚 函数 是 多 态 的 基础 ， 在 C+ + 中 没有 虚 函 数 就 无 法 实现 多 
态 特性 ; 因为 不 声明 为 虚 函 数 就 不 能 实现 “动态 联 编 ”， 就 不 能 实现 多 态 。 








5. 单 例 模式 





要 理解 单 例 模式 ， 只 需要 一 个 实例 就 可 以 了 。 比 如 ， 一 台 计 算 机 上 可 以 连 好 几 台 打印 机 ， 但 是 这 个 计算 机 上 的 打印 程序 只 能 有 一 个 ， 这 里 就 可 以 通过 单 例 模式 来 避免 两 个 打印 作业 同时 输出 到 打印 机 
中 ， 即 在 整个 的 打印 过 程 中 只 有 一 个 打印 程序 的 实例 。 对 于 这 种 问题 ，《 设 计 模 式 》 一 书 中 给 出 了 一 种 很 不 错 的 实现 ， 定 义 一 个 单 例 类 ， 使 用 类 的 私有 静态 指针 变量 指向 类 的 唯一 实例 ， 并 用 一 个 公有 的 静 
态 方法 来 获取 该 实例 。 单 例 模式 的 作用 就 是 保证 在 整个 应 用 程序 的 生命 周期 中 的 任何 一 个 时 刻 ， 单 例 类 的 实例 都 只 存在 一 个 〈 当 然 也 可 以 不 存在 ) 。 


































































































单 例 模 式 通 过 类 本 身 来 管理 其 唯一 实例 ， 唯 一 的 实例 是 类 的 一 个 普通 对 象 ， 但 设计 这 个 类 时 ， 让 它 只 能 创建 一 个 实例 并 提供 对 此 实例 的 全 局 访问 ， 具 体 可 以 参见 下 面 的 例 2.33。 











[£12.33] ” 单 例 模式 使 用 举例 。 

















#include<iostream> 

using namespace std; 

class CSingleton( 

private: 
CSingleton()( // 构造 函数 是 私有 的 
l 


static CSingleton *m pInstance; 


public: 
static CSingleton * GetInstance()( 
if (m pInstance == NULL) // PERRA 
m pInstance = new CSingleton(); 
return m pInstance; 
} 
uu 
CSingleton * CSingleton::m pInstance-NULL; // 初始 化 静态 数据 成 员 


int main(){ 
CSingleton *sl- CSingleton: :GetInstance () 7 
CSingleton *s2- CSingleton::GetInstance(); 
if (s1==s2) { 
cout««"s1-s2"««endl; // 程序 的 执行 结果 是 输出 了 s1=s2 
} 


return 0; 





程序 的 执行 结果 是 : 





sl=s2 














例 2.33 中 ， 用 户 访问 实例 的 唯一 方法 只 有 Getlnstance () 成 员 函 数 。 如 果 不 通 过 这 个 函数 ， 任 何 创建 实例 的 尝试 都 将 失败 ， 因 为 类 的 构造 函数 是 私有 的 。Getinstance () 的 返回 值 是 当 这 个 函数 首次 
被 访问 时 被 创建 的 ， 所 有 Getlnstance () 之 后 的 调用 都 返回 相同 实例 的 指针 。 






































单 例 类 CSingleton 有 以 下 特征 : @ 有 一 个 指向 唯一 实例 的 静态 指针 m_plnstance， 并 且 是 私有 的 ; @ 有 一 个 公有 的 函数 ， 可 以 获取 这 个 唯一 的 实例 ， 并 且 在 需要 的 时 候 创 建 该 实例 ; @@ 其 构造 函数 是 私 
有 的 ， 这 样 就 不 能 从 别处 创建 该 类 的 实例 。 





24 本章 小 结 


本 章 从 对 象 的 封装 、 继 承 、 多 态 这 三 大 特征 来 带领 读者 学 习 面 向 对 象 的 C++。 这 3 个 特征 分 别 解决 了 以 下 问题 。 
(0) 封装 : 找到 变化 并 且 把 它 封装 起 来 ， 就 可 以 在 不 影响 其 他 部 分 的 前 提 下 修改 或 扩展 被 封装 的 变化 部 分 。 封 装 解决 了 程序 的 可 扩展 性 。 


(2) 继承 : 子 类 继承 父 类 ， 可 以 继承 父 类 的 方法 及 属性 ， 实 现 了 多 态 以 及 代码 的 重用 ， 解 决 了 系统 的 重用 性 和 扩展 性 ， 但 是 继承 破坏 了 封装 ， 因 为 其 是 对 子 类 开放 的 ， 修 改 父 类 会 导致 所 有 子 类 的 改 
变 ， 因 此 继承 一 定 程度 上 又 破坏 了 系统 的 可 扩展 性 ， 所 以 继承 需要 慎 用 。 继 承 是 在 程序 开发 过 程 中 重 构 得 到 的 ， 而 不 是 程序 设计 之 初 就 使 用 继承 ， 很 多 面向 对 象 开 发 者 滥用 继承 ， 结 果 可 能 造成 后 期 的 代码 
解决 不 了 需求 的 变化 。 因 此 优先 使 用 组 合 ， 而 不 是 继承 ， 是 面向 对 象 开发 中 一 个 重要 的 经 验 。 


G) 多 态 : 接口 的 多 种 不 同 的 实现 方式 即 为 多 态 。 接 口 是 对 行为 的 抽象 ， 上 面 在 “封装 ”中 提 到 ， 找 到 变化 部 分 并 封装 起 来 ， 但 是 封装 起 来 后 ， 怎 么 适应 接 下 来 的 变化 ? 这 正 是 接口 的 作用 ， 接 口 的 主 
要 目的 是 为 不 相关 的 类 提供 通用 的 处 理 服务 ， 从 而 实现 系统 的 可 维护 性 、 可 扩展 性 。 


因此 ， 面 向 对 象 实现 了 人 们 追求 的 系统 可 维护 性 、 可 扩展 性 、 可 重用 性 。 


第 3 章 将 学 习 STL， 了 解 如 何 更 高 效 地 写 程序 ， 玩 转 C++。 


第 3 章 ”常用 STL 的 使 用 


331 STLEMTA, 









































当今 时 代 是 一 个 信息 时 代 ， 科 技 的 发 展 所 带 来 的 便利 影响 了 人 们 生活 中 的 每 个 细节 ，STL 就 是 这 个 时 代 组 件 化 大 生产 的 产物 。 正 如 其 他 科技 成 果 一 样 ，C++ 程 序 员 也 应 该 努力 使 自己 适应 并 充分 利用 这 
个 “高 科技 成 果 ”。 


STL 是 一 个 标准 模板 库 ， 是 一 个 高 效 的 C+ + 程序 库 。 接 下 来 将 以 一 个 实例 程序 为 例 ， 逐 步 介 绍 STL 的 内 容 与 功能 。 





假设 需要 从 标准 输入 (一般 是 键盘 ) 读 入 一 些 整 型 数据 ， 再 对 它们 排序 ， 然 后 将 结果 输出 到 标准 输出 设备 (一 般 是 显示 器 屏幕 ) ， 那 程序 可 以 如 例 3.1 所 示 。 











【 例 3.1】 ”用 原始 的 方式 将 一 些 数据 进行 排序 。 

















#include<iostream> 
#include<stdlib.h> 
using namespace std; 
#define max size 10 
// 比较 两 个 数 的 大 小 
// 如 果 比 较 函 数 返回 大 于 0，qsort 就 认为 a>b 
// 如 果 比 较 函 数 返回 等 于 0，qsort 就 认为 a=b 
// 如 果 比 较 函 数 返 回 小 于 0，qsort 就 认为 a<b 
int cmp (Const void *a,const void *b)( 

return *(int *)a-*(int *)b; 
} 
int main (){ 

int arr[max size]; 

int n-0; 

往 输 入 设备 中 读 入 整数 ， 同 时 累计 输入 个 数 ， 直 到 输入 的 是 非 整 型 数据 为 止 
for (; ;n++) { 
cin>>arr[n]; 

} 

qsort (arr,n, sizeof (int),cmp); 

for (int i=0;i<n;i++){ 

cout<<arr[i]<<" "; 





return 0; 





以 下 是 某 次 运行 的 结果 : 


输入 : 0 9 2 1 5 输出 : 0 1 2 5 9 























例 3.1 中 用 了 一 个 可 以 放 10 个 整数 的 整 型 数组 ， 来 存放 输入 的 数据 ， 规 定 从 标准 输入 设备 中 读 入 整数 ， 同 时 累计 输入 个 数 ， 直 到 输入 的 是 非 整 型 数据 为 止 ， 还 用 了 (标准 库 的 快速 排序 quit-sort 函 数 来 对 
输入 的 整数 进行 排序 ， 并 将 排序 结果 输出 到 标准 输出 设备 上 。 




































































然而 ， 这 个 程序 并 不 像 看 起 来 那么 健壮 (robust) 。 如 果 用 户 输入 的 数字 数 超过 max_size 所 规定 的 上 限 ， 就 会 出 现 数组 越界 问题 。 为 了 弥补 程序 中 的 这 一 缺陷 ， 必 须 采 用 下 述 方案 中 的 一 种 。 











(1) 采用 大 容量 的 静态 数据 分 配 。 





(2) 限定 输入 的 数据 个 数 。 














(3) 采用 动态 内 存 分 配 。 

















第 一 种 方案 比较 简单 ， 所 做 的 只 是 将 max_size 改 大 一 点 ， 比 如 1000 或 者 10000。 但 是 ， 严 格 讲 这 并 不 能 最 终 解 决 问题 ， 隐 患 仍然 存在 。 此 外 ， 分 配 一 个 大 数组 ， 通 常 是 在 浪费 空间 ， 因 为 大 多 数 情况 
下 ， 数 组 中 的 一 部 分 空间 并 没有 被 利用 。 





























来 看 看 第 二 种 方案 ， 通 过 在 第 一 个 for 循 环 中 加 入 一 个 限定 条 件 ， 可 以 使 问题 得 到 解决 。 比 如 : for (int n=0; cin>>num[n]&&n<max_size; n++) ; 但 是 这 个 方案 同样 不 甚 理 想 ， 尽 管 不 会 使 程 
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序 崩 演 ， 但 失去 了 灵活 性 ,使 用 户 无 法 输入 更 多 的 数 。 


















































看 来 只 有 选择 第 三 种 方案 了 ， 利 用 指针 以 及 动态 内 存 分 配 可 以 妥善 解决 上 述 问题 ， 并 且 使 程序 具有 良好 的 灵活 性 。 这 需要 用 到 new、delete 操 作 符 , 或 者 malloc () ，realloc () 和 free () 函数 ， 但 
是 为 此 ， 程 序 将 牺牲 其 简洁 性 ， 使 代码 量 陡 增 ， 代 码 的 处 理 逻 辑 也 不 再 像 原 先 看 起 来 那么 清晰 了 。 很 难保 证 不 会 在 处 理 这 个 问题 的 时 候 出 错 ， 很 多 程序 的 bug 往 往 就 是 这 样 产 生 的 。 同 时 ，stdlib.h 库 提供 了 
quit-sort 函 数 ， 避 免 了 自己 实现 排序 算法 的 麻烦 。 总 之 ， 需 要 考虑 的 问题 越 来 越 多 。 























接 下 来 就 将 从 STL 的 角度 分 析 并 和 解决 这 类 问题 。 


第 3 章 ”常用 STL 的 使 用 


3.1 ”STL 是 什么 
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当今 时 代 是 一 个 信息 时 代 ， 科 技 的 发 展 所 带 来 的 便利 影响 了 人 们 生活 中 的 每 个 细节 ，STL 就 是 这 个 时 代 组 件 化 大 生产 的 产物 。 正 如 其 他 科技 成 果 一 样 ，C++ 程 序 员 也 应 该 努力 使 自己 适应 并 充分 利 
个 “高 科技 成 果 ”。 


STL 是 一 个 标准 模板 库 ， 是 一 个 高 效 的 C++ 程序 库 。 接 下 来 将 以 一 个 实例 程序 为 例 ， 逐 步 介绍 STL 的 内 容 与 功能 。 























假设 需要 从 标准 输入 (一 般 是 键盘 ) 读 入 一 些 整 型 数据 ， 再 对 它们 排序 ， 然 后 将 结果 输出 到 标准 输出 设备 (一 般 是 显示 器 屏幕 ) ， 那 程序 可 以 如 例 3.1 所 示 。 








【 例 3.1】 ”用 原始 的 方式 将 一 些 数据 进行 排序 。 














#include<iostream> 
#include<stdlib.h> 
using namespace std; 
#define max size 10 







大 于 0，qsort 就 认为 a>b 
等 于 0，qsort 就 认为 a=b 
函数 返回 小 于 0，qsort 就 认为 a<b 
int cmp (Const void *a,const void *b)( 
return *(int *)a-*(int *)b; 
l 
int main(){ 
int arr[max size]; 
int n-0; ` 
// 从 标准 输入 设备 中 读 入 整数 ， 同 时 累计 输入 个 数 ， 直 到 输入 的 是 非 整 型 数据 为 止 
for (77n++) { 
cin»»arr[n]; 
} 
qsort (arr,n, sizeof (int),cmp); 
for (int i=0;i<n;i++){ 
cout<<arr[i]<<" "; 
} 


return 0; 





以 下 是 某 次 运行 的 结果 : 


输入 : 0 9 2 1 5 输出 : 01259 












































例 3.1 中 用 了 一 个 可 以 放 10 个 整数 的 整 型 数组 ， 来 存放 输入 的 数据 ， 规 定 从 标准 输入 设备 中 读 入 整数 ， 同 时 累计 输入 个 数 ， 直 到 输入 的 是 非 整 型 数据 为 止 ， 还 用 了 C 标 准 库 的 快速 排序 quit-sort 函 数 来 对 
输入 的 整数 进行 排序 ， 并 将 排序 结果 输出 到 标准 输出 设备 上 。 















































然而 ， 这 个 程序 并 不 像 看 起 来 那么 健壮 (robust) 。 如 果 用 户 输入 的 数字 数 超过 max_size 所 规定 的 上 限 ， 就 会 出 现 数 组 越界 问题 。 为 了 弥补 程序 中 的 这 一 缺陷 ， 必 须 采 用 下 述 方案 中 的 一 种 。 




















(1) 采用 大 容量 的 静态 数据 分 配 。 





(2) 限定 输入 的 数据 个 数 。 














(3) 采用 动态 内 存 分 配 。 














第 一 种 方案 比较 简单 ， 所 做 的 只 是 将 max_size 改 大 一 点 ， 比 如 1000 或 者 10000。 但 是 ， 严 格 讲 这 并 不 能 最 终 解决 问题 ， 隐 患 仍然 存在 。 此 外 ， 分 配 一 个 大 数组 ， 通 常 是 在 浪费 空间 ， 因 为 大 多 数 情况 
下 ， 数 组 中 的 一 部 分 空间 并 没有 被 利用 。 
































来 看 看 第 二 种 方案 ， 通 过 在 第 一 个 for 循 环 中 加 入 一 个 限定 条 件 ， 可 以 使 问题 得 到 解决 。 比 如 : for (int n=0; cin» »num[n]&&n«max size; n++) ; 但 是 这 个 方案 同样 不 甚 理 想 ， 尽 管 不 会 使 程 
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序 崩 演 ， 但 失去 了 灵活 性 ,使 用 户 无 法 输入 更 多 的 数 。 


















































看 来 只 有 选择 第 三 种 方案 了 ， 利 用 指针 以 及 动态 内 存 分 配 可 以 妥善 解决 上 述 问题 ， 并 且 使 程序 具有 良好 的 灵活 性 。 这 需要 用 到 new、delete 操 作 符 , 或 者 malloc () ，realloc () 和 free () 函数 ， 但 
是 为 此 ， 程 序 将 牺牲 其 简洁 性 ， 使 代码 量 陡 增 ， 代 码 的 处 理 逻 辑 也 不 再 像 原 先 看 起 来 那么 清晰 了 。 很 难保 证 不 会 在 处 理 这 个 问题 的 时 候 出 错 ， 很 多 程序 的 bug 往 往 就 是 这 样 产 生 的 。 同 时 ，stdlib.h 库 提供 了 
quit-sort 函 数 ， 避 免 了 自己 实现 排序 算法 的 麻烦 。 总 之 ， 需 要 考虑 的 问题 越 来 越 多 。 























接 下 来 就 将 从 STL 的 角度 分 析 并 和 解决 这 类 问题 。 


3.2 string 





字符 串 处 理 问 题 是 C++ 语言 编程 中 经 常 遇 到 的 问题 ， 熟 练 地 掌握 字符 串 处 理 的 方法 ， 可 以 增强 对 字符 串 的 存储 和 其 处 理 方法 的 理解 ， 从 而 写 出 高 效 的 C++ 程序 。 





























在 前 面 第 1 章 讲 到 ， 字 符 串 可 以 用 字符 指针 char*、 字 符 数组 等 来 表示 ， 先 来 回顾 一 下 字符 指针 和 字符 数组 的 使 用 注意 点 。 

















比如 下 面 这 几 行 代码 : 





char str[12] = "Hello"; 
Char *p = str; 


*p = 'h'; // 改变 第 一 个 字母 





再 看 这 几 行 代码 : 





char *ptr = "Hello"; 
*ptr = 'h'; // 错误 














第 一 个 字符 串 时 用 数组 开辟 的 ， 它 是 可 以 改变 的 变量 。 而 第 二 个 字符 串 则 是 一 个 常量 ， 也 就 是 不 可 改变 的 值 。ptr 只 是 指向 它 的 指针 而 已 ， 而 不 能 改变 指向 的 内 容 。 这 部 分 区 别 看 两 者 的 汇编 语言 即 可 明 





















































































































































me 
char p[]-"Hello*; 的 汇编 代码 如 下 : 
004114B8 mov eax,dword ptr [string "Hello" (4166FCh)] 
004114BD mov dword ptr [ebp-10h],eax 
004114C0 mov cx,word ptr ds:[416700h] 
004114C7 mov word ptr [ebp-0OCh],cx 
char*ptr-"Hello"; 的 汇编 代码 如 下 : 
004114CB mov dword ptr [ebp-lCh],offset string "Hello" (4166FCh) 
可 见 用 数组 和 用 指针 是 完全 不 相同 的 。 
要 想 通 过 指针 来 改变 常量 是 错误 ， 正 确 的 写法 应 该 是 用 const 指 针 ， 如 下 所 示 : 
const char *ptr = "Hello"; 
除了 以 上 限制 外 ， 字 符 数组 、 字 符 指针 的 字符 串 会 有 要 考虑 内 存 释 放 是 否 足够 、 字 符 串 长 度 等 的 问题 ， 因 此 本 章 主要 讲解 string。 它 是 一 个 字符 串 的 类 ， 它 集成 的 操作 函数 足以 完成 大 多 数 情 况 下 的 需 
。 可 以 用 “=” 进 行 赋 值 操作 ，“==” 进 行 比较 ，“+” 做 串联 ， 使 用 非常 简单 ， 甚 至 可 直接 把 它 看 作 C++ 的 基本 数据 类 型 。 
为 了 在 程序 中 使 用 string 类 型 ， 必 须 包含 头 文件 <string>， 如 下 所 示 : 
#include<string> 
Os 


sttingh 和 cstting 都 不 是 stting 类 的 头 文件 ， 这 两 个 头 文件 主要 定义 C 语 言 风格 字符 囊 操 作 的 一 些 方法 ， 辟 如 sttlen () ~ strepy () 等 。sttingh 是 C 语 言 的 头 文件 格式 ， 而 cstting 是 C++ 风格 的 头 文件 ， 但 是 和 
<sttingh> 是 一 样 的 ， 它 的 目的 是 为 了 和 C 语 言 兼容 。 


1.string 类 的 实现 
实现 string 类 是 一 道 考验 C+ + 基础 知识 的 好 题 ， 接 下 来 先 看 这 样 的 一 道 题目 ， 了 解 string 类 的 内 部 实现 。 


已 知 类 string 的 原型 代码 如 下 所 示 ， 请 编写 类 string 的 7 个 类 。 





class String( 
public: 


String(const char *str = NULL); // 普通 构造 函数 
String(const String &other); // 拷贝 构造 函数 
~ String(); // 析 构 函数 
String & operator =(const String &other); // 赋值 函数 
String & operator +(const String &other); // 字符 串 连 接 
bool operator 一 (const String &other); // 判断 相等 
int getLength(); // 返回 长 度 

private: 
char *m data; // 私有 变量 保存 字符 囊 


H 








从 上 述 程序 可 以 看 到 ，string 类 其 实 是 一 个 对 字符 串 指针 有 一 系列 操作 动作 的 类 ， 也 就 是 说，string 类 的 底层 是 一 个 字符 串 指针 。 这 一 题 的 参考 答案 以 及 注意 点 如 下 所 示 。 





(1) 普通 构造 函数 。 





String::String(const char *str)( 
if (str--NULL) { 
m data = new char[1]; 
*m data = 'N0'; 
// 对 空 字 符 串 自动 申请 存放 结束 标志 "\0! 的 加 分 点 : 对 m_data 加 NULL 判断 
} 
else{ 
int length = strlen (str); 
m data = new char[length+1]; 
strcpy(m data, str); 
} 


























普通 构造 函数 里 需要 注意 的 是 ， 传 入 的 是 个 char* 类 型 的 字符 串 。 如 果 传 入 的 str 是 个 空 的 字符 串 ， 那 这 个 string 就 也 是 一 个 空 的 字符 串 ， 直 接 用 \0 赋 值 。 如 果 传 入 的 str 是 非 空 字 符 串 ， 私 有 变量 m_data 
就 需要 预 留 length+1 的 长 度 ， 其 中 “+1” 是 用 来 放 最 后 的 \0 的 ， 因 为 strlen 计 算 字 符 串 长 度 时 ， 没 把 \0 算 进 去 。 









































(2) String 的 析 构 函数 。 


String::-String()( 
if(m data)( 
delete[] m data; // 或 delete m data; 


m data-0; 























析 构 函数 的 











功能 





是 删除 成 员 变 量 ， 需 


先 判断 字符 指针 是 否 为 空 ， 如 果 不 为 空 ， 再 将 其 








删除 ， 并 将 其 











(3) 拷贝 构造 函数 。 





指向 NULL。 





String::String(const String &other)( 
if(lother.m data) { 
m data-0; 
} 


m data = new char[strlen (other.m data)+1]; 


strcpy(m data, other.m data); 


// 输入 参数 为 const 型 
// 对 m_data 加 NULL 判断 





拷贝 构造 函数 里 需要 注意 的 是 ， 传 入 的 参数 是 个 常 引 
(4) 赋值 函数 。 














' 








这 样 可 以 不 





新 增 一 个 栈 变量 和 参数 内 容 可 以 保持 不 变 ， 不 被 修改 。 





String & String::operator -(const String &other)( 


// 输入 参数 为 const 型 
if (this != &other){ 
delete[] m data; 
if(!other.m data) { 
m data-0; 
} 
else{ 


// 检查 是 否 自 赋值 
// 释放 原 有 的 内 存 资 源 
// 对 m_data 作 NULL 判断 


m data-new char[strlen(other.m data)+1]; 


strcpy(m data, other.m data); 


return *this; 


// 返回 本 对 象 的 引用 





赋值 函数 里 需 


(5) 字符 





连接 。 


di 


注意 的 是 ， 如 果 传 入 的 参数 内 容 已 与 本 身 的 内 容 一 致 ， 则 不 需要 赋值 。 如 果 传 入 的 参数 内 容 与 本 身 内 容 不 一 致 ， 需 要 先 清空 本 身 的 内 容 。 





String & String::operator + (Const String &other)( 


String newString; 

if(lother.m data) { 
newString=*this; 

l 

else if(!m data){ 
newString-other; 

} 

else{ 


newString.m data-new char [strlen (m data)+strlen (other.m data) +1]; 


strcpy (newString.m data,m data); 


strcat (newString.m data,other.m data); 


} 


return newString; 











字符 串 连 接 函 数 里 需要 注意 的 分 3 种 情况 : 传 入 的 参数 内 容 为 空 、 本 身 内 容 为 空 或 两 者 内 容 都 不 为 空 。 
(6) 判断 相等 。 
bool String::operator- -(const String &other)( 


if (strlen (m data) !-strlen(other.m data))í 


return false; 


elset 


return strcmp (m data,other.m data)?false:true; 


li 





判断 相等 函数 ， 返 回 值 只 有 true 和 false， 先 判断 长 度 是 否 一 致 ， 再 判断 内 容 是 否 一 致 。 


(7) 返回 长 度 。 





int String: :getLength () { 
return strlen (m data); 
} 











返回 长 度 函 数 ， 只 需 用 strlen 直 接 计 算 char* 的 长 度 即 可 。 

















2.string 声 明 方 式 


字符 串 变 量 的 声明 形式 如 下 : 








string Str; 








m 


这 样 就 声明 了 一 个 字符 串 变量 ， 但 既然 是 一 个 类 ， 就 有 构 





string 类 的 构造 函数 和 析 构 函数 如 下 所 示 : 





造 函 数 和 析 构 函数 。 上 面 的 声明 没有 传 入 参数 ， 所 以 就 直 





接 使 

















了 string 的 默认 的 构造 函数 ， 这 个 函数 所 做 的 就 是 把 Str 初 始 化 为 一 个 空 字符 





string s; // 生成 一 个 

string s(string str) 

string s(string str,int stridx) 
// 字符 囊 的 初 值 


string s(char *str,int stridx,int strlen) 


// 拷贝 构造 函数 
// 将 字符 


// 3 


PS 
生成 str 的 复制 品 
str 内 “ 始 于 位 置 stridx” 的 部 分 当 作 


字符 囊 str 内 “ 始 于 stridx 且 长 度 项 多 strlen” 


// 的 部 分 作为 字符 串 的 初 值 


S(char *cstr) 
S(char *chars,int chars len) 


7/ 初 值 


string 
string 


string s(int num,char c) 

string s(char *beg,char *end) 
// 串 s 的 初 值 

s.-string() 


// 将 C 字 符 串 作为 s 的 初 什 
// 将 C 字 符 


// 生成 一 个 字符 囊 ， 包 含 num 个 c 字 符 
// 以 区 间 beg;end (不 包含 end) 内 的 字符 作为 字符 





前 chars_len 个 字符 作为 字符 串 s 的 


// 销毁 s 字 符 ， 释 放 内 存 





string 类 的 声明 如 例 3.2 所 示 。 


【 例 3.2】 string 的 声明 。 





#include<iostream> 

#include<string> 

using namespace std; 

int main (){ 
string strl-"Spend all your time waiting."; 
string str2-"For that second chance."; 
string str3(strl,6); // "all your time waiting." 
string str4(str1,6,3); // "all" 
char ch music[]-("Sarah McLachlan"]; 
string str5-ch music; 
string str6(ch music); 


string str? (ch music,5); // "Sarah" 
string str8(4,'a'); // aaaa 
string str9(ch musict6,ch music*14); // " McLachlan" 


cout««"strl:"«Xstrl««endl; 
Ccout««"str2:"««str2««endl; 
cout««"str3:"««str3««endl; 
Cout««"str4:"««str4««endl; 
Cout««"str5:"««str5««endl; 
cout««"str6:"««str6««endl; 
cout««"str7:"««str7««endl; 
cout««"str8:"««str8««endl; 
Cout««"str9:"««str9««endl; 
return 0; 





程序 的 执行 结果 是 : 





strl:Spend all your time waiting. 
str2:For that second chance. 
str3:all your time waiting. 
str4:all 

str5:Sarah McLachlan 

str6:Sarah McLachlan 

str7:Sarah 

str8:aaaa 

str9:McLachla 








例 3.2 中 展示 了 声明 一 个 string 字 符 串 的 各 种 方式 。 


3.C++ 字 符 串 和 C 字 符 串 的 转换 




















C++ 提供 的 由 C++ 字符 串 转换 成 对 应 的 C 字 符 串 的 方法 是 使 用 data () . c str () 和 copy () 来 实现 。 其 中 ，data () 以 字符 数组 的 形式 返回 字符 串 内 容 ， 但 并 不 添加 \0 ; c str () 返回 一 个 
以 \0 结尾 的 字符 数组 ; 而 copy () 则 把 字符 串 的 内 容 复 制 或 写 入 既 有 的 c_string 或 字符 数组 内 。 需 要 注意 的 是 ，C+ + 字符 串 并 不 以 \0 结尾 。 









































c str () 语句 可 以 生成 一 个 const char* 指 针 ， 并 指向 空 字符 的 数组 。 这 个 数组 的 数据 是 临时 的 ， 当 有 一 个 改变 这 些 数据 的 成 员 函 数 被 调用 后 ， 其 中 的 数据 就 会 失效 。 因 此 要 么 现 用 现 转换 ， 要 么 把 它 的 
数据 复制 到 用 户 自己 可 以 管理 的 内 存 中 后 再 转换 。 






































【 例 3.3】 c_str O 使 用 方法 举例 。 














#include<iostream> 
#include<string> 
using namespace std; 
int main (){ 
string str-"Hello world. "; 
const char * cstr-str.c str(); 
cout««cstr««endl; T 
str-"Abcd."; 
cout««cstr««endl; 
return 0; 


程序 的 执行 结果 是 : 





Hello world. 
Abcd. 














如 例 3.3 所 示 ， 改 变 了 str 的 内 容 ，cstr 的 内 容 也 会 随 着 改变 。 所 以 上 面 如 果 继 续 使 用 C 指 针 的 话 ， 导 致 的 错误 将 是 不 可 想象 的 。 既 然 C 指 针 指向 的 内 容 容易 失效 ， 就 可 以 考虑 把 数据 复制 出 来 解决 问题 。 


























【 例 3.4】 ”将 c_str() 里 的 内 容 复制 出 来 以 保持 有 效 性 。 


#include<iostream> 

#include<string> 

#include<string.h> 

using namespace std; 

int main (){ 
char * cstr=new char[20]; 
string str-"Hello world. "; 
strncpy (cstr, str.c str(),str.size()); 
cout««cstr««endl; ` 
str-"Abcd."; 
cout««cstr««endl; 
return 0; 





程序 的 执行 结果 : 





Hello world. 
Hello world. 

















例 3.4 中 用 strcpy 函 数 将 str.c_str () 的 内 容 复 制 到 cstr 里 了 ， 这 样 就 能 保证 cstr 里 的 内 容 不 随 着 str 的 内 容 改变 而 改变 





copy (p, n, size type_Off=0) 这 句 表明 从 string 类 型 对 象 中 至 多 复制 n 个 字符 到 字符 指针 p 指 向 的 空间 中 ， 并 且 默 认 从 首 字符 开始 ， 也 可 以 指定 开始 的 位 置 (从 0 开始 计数 ) ， 返 回 真正 从 对 象 中 复制 
的 字符 。 不 过 确保 p 指 向 的 空间 足够 来 保存 n 个 字符 。 
































可 














【 例 3.5】 string.copy 用 法 的 详细 举例 。 











fincludeciostream» 
fincludecstring» 
using namespace std; 
int main (){ 
size t length; 
char buffer [8]; 


string str("Test stringhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/ . .http://www.hzcourse .com/resource/readBook?p 


Ccout««"str:"««str««endl; 

length-str.copy (buffer, 7,5); 

buffer[length]-'N0'; 

cout«e"str.copy (buffer, 7,5), buffer contains: "««buffer««endl; 
lengthestr.copy (buffer,str.size(),5); 

buffer[length]-'N0'; 

cout««"str.copy (buffer,str.size(),5),buffer contains:"««buffer««endl; 
lengthestr.copy (buffer, 7,0); 

buffer [length]='\0'; 

Cout<< "str.copy (buffer, 7,0),buffer contains:"<<buffer<<endl; 
length-str.copy (buffer,7); // 缺 省 参数 pos， 默 认 pos=0; 
buffer[length]="'\0'; 

cout««"str.copy (buffer,7),buffer contains:"««buffer««endl; 
length-str.copy (buffer, string: :npos, 5) ; 

buffer [length]='\0'; 

cout««"string::npos:"«« (int) (string: :npos) ««endl; 

cout««"buffer string: :npos] :"««buffer[string: :npos] ««end1; 
cout««"buffer [length-1l]:"««buffer|length-1]««endl; 

cout««"str.copy (buffer,string::npos,5),buffer contains:"««buffer««endl; 
lengthestr.copy (buffer, string: :npos); 

buffer [length]='\0'; 

cout««"str.copy (buffer, string: :npos) ,buffer contains :"<<buffer<<endl; 
cout««"buffer[string::npos]:"««buffer[string: :npos]««endl; 
cout««"buffer [length-1]:"««buffer[length-1]««enadl; 

return 0; 














程序 的 执行 结果 是 : 








str:Test stringhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/ . . http: //www.hzcourse.com/resource/readBook?path-/openres 


str.copy(buffer,7,5),buffer contains: string. 


( 
str.copy (buffer,str.size(),5),buffer contains:stringhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/ . . http: / /www .hzcours 
( 


str.copy(buffer,7,0),buffer contains:Test st 
str.copy (buffer,7),buffer contains:Test st 
string::npos:-1 

buffer[string::npos]: 

buffer[length-1]:. 


str.copy (buffer, string: :npos, 5) ,buffer contains:stringhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text./ . .http: / /www.hzcov 
str.copy (buffer, string: :npos) ,buffer contains:Test stringhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/. .http: / /www.hz 


buffer[string::npos]: 
buffer[length-1]:. 











例 3.5 中 展示 了 通过 不 同 的 方法 用 string 的 copy 方 法 进行 字符 串 的 复制 ， 常 见 的 api 的 参数 一 般 是 把 起 始点 信息 放 在 前 面 
strlen) ; 而 copy 方 法 却 是 把 长 度 放 在 起 始点 前 面 ， 这 个 是 需要 小 心 使 用 的 。 另 外 ，copy 函 数 的 第 二 个 参数 ， 除 了 可 以 是 长 度 ， 也 可 以 是 一 个 位 置 ， 如 string: : npos。 





























， 长 度 信息 放 在 后 面 


， 如 string 的 构造 函数 string s (char*str, int stridx，int 


string: : npos 是 一 个 机 器 最 大 的 正 整 数 ， 不 同 机 器 不 一 样 ， 如 64 位 机 器 是 18446744073709551615， 而 32 位 机 器 则 是 4294967295， 类 型 是 std: : container type: : size type。 可 以 将 其 强制 转 

















换 成 int， 就 是 -1， 这 样 就 不 会 存在 移植 的 问题 。 一 般 用 npos 表 示 string 的 结束 位 置 。 





copy 函 数 的 第 三 个 参数 不 填 时 则 默认 为 0， 即 从 第 一 个 字符 开始 。 




















综 上 ， 可 以 使 用 string 的 c_str () 、data () 、copy (p, n) ， 从 一 个 string 类 型 得 到 一 个 C 类 型 的 字符 数组 。 


4.string 和 int 类 型 的 转换 


(1) int 转 string 的 方法 。 














这 里 需要 用 到 snprintf () ， 函 数 原 型 为 : 





int snprintf(char *str, size t size, const char *format, http://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...) 





它 的 功能 主要 是 将 可 变 个 参数 (http:///www.hzcourse.com/resource/readBook?path z/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...) 按照 format 格 式 化 成 字符 
将 其 复制 到 str 中 ， 具 体 如 下 所 述 。 











1) 如 果 格 式 化 后 的 字符 串 长 度 小 于 size， 则 将 此 字符 串 全 部 复制 到 str 中 ， 并 给 其 后 添加 一 个 字符 串 结束 符 (NO) 。 




















2) 如 果 格 式 化 后 的 字符 串 长 度 不 小 于 size， 则 只 将 











3) 函数 的 返回 值 是 若 成 功 ， 则 返回 欲 写 入 的 字符 串 长 度 ， 若 出 错 则 返回 负 值 。 


4) 如 果 原 始 参数 为 “...”， 那 么 这 是 个 可 变 参数 。 








【 例 3.6】 ”snprintf 的 使 用 举例 。 














, 然后 


tilt 





中 的 (size-1) 个 字符 复制 到 str 中 ， 并 给 其 后 添加 一 个 字符 串 结束 符 (^\0') ， 返 回 值 为 欲 写 入 的 字符 串 长 度 。 





#include<stdio.h> 
int main ()( 
char a[20]; 
int i = snprintf(a, 9, "$012d", 12345); 
printf("i = $d, a = $s", i, a); 
return 0; 








程序 的 执行 结果 是 : 





= 12, a = 00000001 





之 后 按 前 面 的 格式 输出 。 那 就 是 先 得 到 了 000000012345， 再 取 前 面 











例 3.6 中 ，%012d 的 格式 是 指使 输出 的 int 型 的 数值 以 12 位 的 固定 位 宽 输 出 ， 如 果 不 足 12 位 ， 则 在 前 面 补 0， 如 果 超 过 12 位 ， 则 按 实 际 位 数 输 出 。 如 果 输 出 的 数值 不 是 int 型 ， 则 进行 强制 类 型 转换 为 int， 




















与 此 类 似 的 ， 将 int 转 换 为 string， 代 码 通常 可 以 这 么 写 : 


static inline std::string i64tostr(long long a)( 
char buf[32]; 
snprintf(buf, sizeof(buf), "$11d", a); 
return std::string (buf); 


(2) string 转 int 的 方法 。 








这 里 需要 用 到 strtol，strtoll，strtoul 或 strtoull 函 数 ， 它 们 的 函数 原型 分 别 如 下 所 示 : 

















(9-1) 位 ， 即 8 位 ， 则 是 00000001。 








则 


long int strtol(const char *nptr, char **endptr, int base); 


long long int strtoll(const char *nptr, char **endptr, int base); 
unsigned long int strtoul(const char *nptr, char **endptr, int base); 
unsigned long long int strtoull(const char *nptr, char **endptr, int base); 


它们 的 功能 是 将 参数 nptr 字 符 串 根据 参数 base 来 转换 成 有 符号 的 整 型 数 、 有 符号 的 长 整 型 数 ， 无 符号 的 整 型 数 、 无 符号 的 长 整 型 数 。 参 数 base 范 
base 值 为 10 则 采用 10 进 制 ; 若 base 值 为 16 则 采用 16 进 制 数 等 ; 当 base 值 为 0 时 会 根据 情况 选择 有 












































strtol 使 用 如 例 3.7 所 示 。 








【 例 3.7】 ”strtol 的 使 用 举例 。 












































目 从 2~36， 或 0。 参 数 base 代 表 采 用 的 进 制 方式 ， 如 






































哪 种 进 制 : 如 果 第 一 个 字符 是 0， 就 判断 第 二 字符 如 果 是 x 则 用 16 进 制 ， 否 则 用 8 进 制 ， 第 一 个 字符 不 是 0， 
10 进 制 。 一 开始 strtoul () 会 扫描 参数 nptr 字 符 串 ， 跳 过 前 面 的 空格 字符 串 ， 直 到 遇 上 数字 或 正 负 符 号 才 开 始 做 转换 ， 再 遇 到 非 数字 或 字符 串 结束 时 () 结束 转换 ， 并 将 结果 返回 。 若 参数 endptr 不 
为 NULL， 则 会 将 遇 到 不 合 条 件 而 终止 的 nptr 中 的 字符 指针 由 endptr 返 回 。 

















#include<iostream> 

#include<stdlib.h> 

#include<string> 

using namespace std; 

int main()( 
char *endptr; 
char nptr[]-2"123abc"; 
int ret = strtol(nptr, &endptr, 10 ); 
cout««"ret;"««ret««endl; 
cout««"endptr: "««endptr««endl; 
char *endptr2; 
char nptr2[]-" \n\t abc"; 
ret = strtol(nptr2, &endptr2, 10 ); 
Ccout««"ret:"««ret««endl; 
cout««"endptr2:"««endptr2««endl; 
char *endptr8; 
char nptr8[]-2"0123"; 
ret = strtol(nptr8, &endptr8,0); 
cout««"ret:"««ret««endl; 
cout««"endptr8: "««endptr8««endl; 
char *endptrl6; 
char nptr16[]-"0x123"; 
ret = strtol(nptrl6, &endptr16,0); 
Ccout««"ret;"««ret««endl; 
cout««"endptri6:"««endptr16««endl; 
return 0; 





程序 的 执行 结果 是 : 


ret:123 
endptr:abc 
ret:0 
endptr2: 
abc 
ret:83 
endptr8: 
ret:291 
endptrl6: 














例 3.7 中 主要 是 使 用 strtol 函 数 对 不 同 的 字符 串 取出 整数 。 














char nptr[]-2"123abc"; 
int ret = strtol(nptr, &endptr, 10 ); 





十 进 制 里 没有 “数字 ”a， 所 以 扫描 到 a 就 结束 ， 因 此 ret 值 是 123， 即 endptr 是 abc。 








char *endptr2; 
char nptr2[]=" \n\t abc"; 
ret = strtol(nptr2, &endptr2, 10 ); 


由 于 函数 会 忽略 nptr 前 面 的 空格 ， 所 以 从 字符 a 开 始 扫描 ， 但 是 遇见 的 “第 一 个 ” 即 是 不 合法 字符 ， 所 以 函数 结束 ， 此 时 ret=0; endptr-nptr; 





char *endptr8; 

char nptr8[]-2"0123"; 

ret = strtol(nptr8, &endptr8,0); 
char *endptrl6; 

char nptr16[]-2"0x123"; 

ret = strtol(nptrl6, &endptr16,0); 





当 第 三 个 参数 为 0 时 ， 则 分 以 下 3 种 情况 。 
1) 如 果 nptr 以 0x 开 头 ， 则 把 nptr 当 成 16 进 制 处 理 。 
2) 如 果 npstr 以 0 开头 ， 则 把 nptr 当 成 8 进 制 处 理 。 


3) 否则 ， 把 nptr 当 成 10 进 制 。 


nptr8 是 以 0 开头 的 ， 所 以 将 nptr8 当 成 8 进 制 处 理 ， 再 将 8 进 制 的 0123 转 换 为 10 进 制 的 ， 得 到 了 1*8^2+2*8+3=83。nptr16 是 以 0x 


制 的 ， 得 到 了 1*16^2+2*16+3=291。 


此 ， 将 字符 串 转换 为 10 进 制 的 数字 ， 可 以 这 么 写 : 




















头 的 ， 将 nptr16 当 成 16 进 制 处 理 ， 再 将 16 进 制 的 0x123 转 换 为 10 进 





static inline int64 t strtoint(const std::string& s){ 
return strtoll(s.c str(), 0, 10); 





5.string 的 其 他 常用 成 员 函 数 























string 的 其 他 常用 成 员 函 数 有 以 下 几 个 : 





int capacity() const7 // 返回 当 


int size()const; 当前 字符 串 的 大 小 
int length()const; 前 字符 串 的 长 度 
bool empty () const; // 当前 字符 串 是 否 为 空 





Y: ( 即 string 中 不 必 增 加 内 存 即 可 存放 的 元 素 个 数 ) 
int max size()const; // 返回 string 对 象 中 可 存放 的 最 大 字符 串 的 长 度 


void resize(int len,char c); // 把 字符 囊 当 前 大 小 置 为 len， 并 用 字符 c 填 充 不 足 的 部 分 





3.3 vector 


3.3.1 vector HtA 

















vector 是 线性 容器 ， 它 的 元 素 严格 按照 线性 序列 排序 ， 和 动态 数组 很 相似 。 和 数组 类 似 的 是 ， 它 的 元 素 存储 在 一 块 连续 的 存储 空间 中 ， 这 也 意味 着 不 仅 可 以 使 用 迭代 器 (iterator) 访问 元 素 ， 还 可 以 使 
指针 的 偏 移 方式 访问 。 和 常规 数组 不 一 样 的 是 ，vector 能 够 自动 存储 元 素 ， 可 以 自动 增长 或 缩小 存储 空间 。 
























































vector 的 优点 如 下 所 述 。 








(1) 可 以 使 用 下 标 访问 个 别 的 元 素 。 








(2) 迭代 器 可 以 按照 不 同 的 方式 遍历 容器 。 





(3) 可 以 在 容器 的 未 尾 增加 或 删除 元 素 。 


和 数组 相 比 ， 虽 然 容器 在 自动 处 理 容量 的 大 小 时 会 消耗 更 多 的 内 存 ， 但 是 容器 能 提供 和 数组 一 样 的 性 能 ， 而 且 能 很 好 地 调整 存储 空间 大 小 。 






































和 其 他 标准 的 顺序 容器 相 比 ，vector 能 更 有 效 访 问 容器 内 的 元 素 和 在 未 尾 添加 和 删除 元 素 ， 而 在 其 他 位 置 添加 和 删除 元 素 ，vector 则 不 及 其 他 顺序 容器 ， 在 迭代 器 和 引用 也 不 比 lists 支 持 的 好 。 








容器 的 大 小 和 容器 的 容量 是 有 区 别 的 ， 大 小 是 指 元 素 的 个 数 ， 容 量 是 分 配 的 内 存 大 小 ， 容 量 一 般 不 小 于 容器 的 大 小 。vector: : size () 返回 容器 的 大 小 ，vector: : capacity () 返回 容量 值 ， 容 量 
于 容器 大 小 的 部 分 用 于 以 防 容器 大 小 的 增加 使 用 。 每 次 重新 分 配 内存 都 会 很 影响 程序 的 性 能 ， 所 以 一 般 分 配 的 容量 都 大 于 容器 的 大 小 ， 若 要 自己 指定 分 配 的 容量 的 大 小 ， 则 可 以 使 用 vector: : 
reserve () ， 但 是 规定 的 值 要 大 于 size () 值 。 







































































使 用 vector 时 需要 包含 的 头 文件 #include<vector> 。 








3.4 map 


34.41 _ map 是 什么 


1.map 的 本 质 

map 本 质 是 一 类 关联 式 容器 ， 属 于 模板 类 关联 的 本 质 在 于 元 素 的 值 与 某 个 特定 的 键 相关 联 ， 而 并 非 通 过 元 素 在 数组 中 的 位 置 类 获取 。 它 的 特点 是 增加 和 删除 节点 对 进 代 器 的 影响 很 小 ， 除 了 操作 节点 ， 
对 其 他 的 节点 都 没有 什么 影响 。 对 于 迭代 器 来 说 ， 不 可 以 修改 键 值 ， 只 能 修改 其 对 应 的 实 值 。map 内 部 数据 的 组 织 ，map 内 部 自 建 一 棵 红 黑 树 (一 种 非 严格 意义 上 的 平衡 二 叉 树 ) ， 这 棵 树 具有 对 数据 自动 
排序 的 功能 ， 所 以 在 map 内 部 所 有 的 数据 都 是 有 序 的 。 



























































2.map 的 功能 















































自动 建立 Key-value 的 一 一 对 应 关系 。 比 如 一 个 班级 中 ， 每 个 学 生 的 学 号 跟 他 的 姓名 就 存在 着 一 一 映射 的 关系 ， 这 个 模型 用 map 可 能 轻易 描述 ， 很 明显 学 号 用 int 描 述 ， 姓 名 用 字符 串 描述 (本 篇 文章 中 
不 用 char* 来 描述 字符 串 ， 而 是 采用 STL 中 string 来 描述 ) ， 可 以 使 用 这 样 的 一 个 map: Map<int，string>mapStudent; 
























































key 和 value 可 以 是 任意 你 需要 的 类 型 ， 但 是 需要 注意 的 是 对 于 key 的 类 型 ， 唯 一 的 约束 就 是 必须 支持 < 操作 符 。 























根据 key 值 快速 查找 记录 ， 查 找 的 复杂 度 基本 是 Log (N) ， 即 如 果 有 1000 个 记录 ， 最 多 查找 10 次 ; 1000000 个 记录 ， 最 多 查找 20 次 。 除 此 之 外 ， 还 有 快速 插入 Key-Value 记 录 、 快 速 删 除 记 录 、 根 据 
Key 修 改 value 记 录 、 遍 历 所 有 记录 等 功能 。 


3.map 需 要 包括 的 头 文件 











使 用 map 得 包含 map 类 所 在 的 头 文件 : #include<map>// 注 意 ，STL 头 文件 没有 扩展 名 .h。 














3.5 set 


3.5.1 ”set 是 什么 





















































C++STL 之 所 以 得 到 广泛 的 赞誉 ， 也 被 很 多 人 使 用 ， 不 只 是 提供 了 像 vector、string、list 等 方便 的 容器 ， 更 重要 的 是 STL 封 装 了 许多 复杂 的 数据 结构 算法 和 大 量 常用 数据 结构 操作 。vector 封 装 数 组 ，list 
封装 了 链表 ，map 和 set 封 装 了 二 叉 树 等 ， 在 封装 这 些 数据 结构 的 时 候 ，STL 按 照 程序 员 的 使 用 习惯 ， 以 成 员 函 数 方式 提供 的 常用 操作 ， 如 : 插入 、 排 序 、 删 除 、 查 找 等。 让 用 户 在 STL 使 用 过 程 中 ， 并 不 会 
感到 陌生 。 








































































































关于 set， 必 须 说 明 的 是 set 关 联 式 容器 。set 作 为 一 个 容器 也 是 用 来 存储 同一 数据 类 型 的 数据 类 型 ， 并 且 能 从 一 个 数据 集合 中 取出 数据 ， 在 set 中 每 个 元 素 的 值 都 唯一 的 ， 而 且 系 统 能 根据 元 素 的 值 自动 进 
行 排序 。 应 该 注意 的 是 set 中 数 元 素 的 值 不 能 直接 被 改变 。C+ + STL 中 标准 关联 容器 set、multiset、map、multimap 内 部 采用 的 都 是 红 黑 树 。 红 黑 树 的 统计 性 能 要 好 于 一 般 平 衡 二 叉 树 ， 所 以 被 STL 选 择 作 
为 了 关联 容器 的 内 部 结构 。 





















































关于 set 有 下 面 几 个 问题 需要 注意 。 




















(1) 为 何 map 和 set 的 插入 删除 效率 比 用 其 他 序列 容器 高 ? 


























表面 上 看 ， 因 为 对 于 关联 容器 来 说 ， 不 需要 做 内 存 拷贝 和 内 存 移动 。set 容 器 内 所 有 元 素 都 是 以 节点 的 方式 来 存储 ， 其 节点 结构 和 链表 差不多 ， 指 向 父 节点 和 子 节点 ，set 的 结构 图 如 图 3-6 所 示 。 














图 3-6 set 的 结构 图 





因此 插入 的 时 候 只 需要 稍 做 变换 ， 把 节点 的 指针 指向 新 的 节点 就 可 以 了 。 删 除 的 时 候 类 似 ， 稍 做 变换 后 把 指向 删除 节点 的 指针 指向 其 他 节点 即 可 。 这 里 的 一 切 操作 就 是 指针 换 来 换 去 ， 和 内 存 移动 没有 


(2) 为 何 每 次 insert 之 后 ， 以 前 保存 的 iterator 不 会 失效 ? 





iterator 这 里 就 相当 于 指向 节点 的 指针 ， 内 存 没有 变 ， 指 向 内 存 的 指针 怎么 会 失效 呢 (当然 被 删除 的 那个 元 素 本 身 已 经 失效 了 ) 。 相 对 于 vector 来 说 ， 每 一 次 删除 和 插入 ， 指 针 都 有 可 能 失效 ， 调 用 
push_back 在 尾部 插入 也 是 如 此 。 因 为 为 了 保证 内 部 数据 的 连续 存放 ，iterator 指 向 的 那 块 内 存在 删除 和 插入 过 程 中 可 能 已 经 被 其 他 内 存 履 盖 或 者 内 存 已 经 被 释放 了 。 即 使 用 push_back 的 时 候 ， 容 器 内 部 空 
间 可 能 不 够 ， 需 要 一 块 新 的 更 大 的 内 存 ， 只 有 把 以 前 的 内 存 释放 ， 并 申请 新 的 更 大 的 内 存 ， 并 复制 已 有 的 数据 元 素 到 新 的 内 存 ， 最 后 把 需要 插入 的 元 素 放 到 最 后 来 解决 ， 那 么 以 前 的 内 存 指针 自然 就 不 可 用 
了 。 特 别 是 在 和 find 等 算法 在 一 起 使 用 的 时 候 ， 牢 记 这 个 原则 : 不 要 使 用 过 期 的 iterator。 








(3) 当 数 据 元 素 增多 时 ，set 的 插入 和 搜索 速度 变化 如 何 ? 


如 果 知 道 log2 的 关系 就 应 该 彻底 了 解 这 个 答案 。 在 set 中 查找 是 使 用 二 分 查找 ， 也 就 是 说 ， 如 果 有 16 个 元 素 ， 最 多 需要 比较 4 次 就 能 找到 结果 ， 有 32 个 元 素 ， 最 多 比较 5 次 。 那 么 有 10000 个 元 素 时 为 
log10000， 即 最 多 为 14 次 ， 如 果 是 20000 个 元 素 呢 ? 最 多 不 过 15 次 。 可 见 ， 当 数据 量 增 大 一 倍 的 时 候 ， 搜 索 次 数 只 不 过 多 了 1 次 。 当 明白 这 个 道理 后 ， 就 可 以 安心 往 里 面 放 入 元 素 了 。 





36 ”本章 小 结 





本 章 重点 讲述 了 常用 的 几 种 STL 模 板 : stting、vector、map 和 set。 基 本 上 掌握 这 4 种 就 能 满足 日 常 工作 所 需 。 只 要 会 用 了 、 用 惯 了 ， 你 会 发 现 离 不 开 它们 了 。 


读 完 这 一 章 ， 你 会 发 现 ， 不 要 放 过 任何 一 个 看 上 去 很 简单 的 小 编程 问题 ， 它 们 往往 并 不 简单 ， 都 可 以 引申 出 很 多 知识 点 。 


第 4 章 ”编译 


先 来 看 下 第 1 章 就 讲 到 的 hello world 程 序 。 这 个 程序 在 编译 中 是 这 样 进行 的 ， 执 行 g++helloworld.cpp 命 令 编 译 得 到 了 a.out 文 件 ; 执行 ./a.out 命 令 就 可 以 输出 “hello world.”。 事 实 上 ， 执 行 g++helloworld.cpp 
命令 的 这 个 过 程 可 以 分 解 为 4 个 步骤 ， 分 别 是 预 处 理 、 编 译 、 汇 编 和 链接 。 这 就 像 是 一 个 被 隐藏 了 的 过 程 ， 使 用 者 只 需 用 简单 的 命令 即 可 完成 复杂 的 操作 步骤 。 


本 章 将 和 读者 来 一 起 探索 下 这 其 中 的 奥妙 。 


4.1 编译 与 链接 








编译 与 链接 的 过 程 可 以 分 解 为 4 个 步骤 ， 分 别 是 预 处 理 (Prepressing) 、 编 译 (Compilation) 、 汇 编 (Assembly) 和 链接 (Linking) ， 具 体 如 图 4-1 所 示 。 
源 代码 
helloworld.cpp 






































预 处 理 完 毕 ， 得 到 


— 
预 处 理 'cpp 文 件 helloworld.i 





ye 


文件 


iostream 





汇编 完毕 ,得 到 


helloworld.o 





静态 库 libc.a 用 as 汇编 











图 4-1 编译 与 链接 的 过 程 











1. 预 处 理 


首先 是 源 代码 文件 helloworld.cpp 和 相关 的 头 文 件 ， 如 iostream 等 被 预 处 理 器 cpp 预 处 理 成 一 个 .i 文件。 第 一 步 预 处 理 的 过 程 相 当 于 如 下 命令 (-E 表 示 只 进行 预 处 理 ) : 


编译 完毕 
helloworld.s 






用 g++ 编译 


得 到 





g++ -E helloworld.cpp -o helloworld.i 








其 中 : -E 的 编译 选项 ， 意 味 着 只 执行 到 预 编译 ， 直 接 输出 预 编译 结果 





预 处 理 过 程 主要 处 理 那 些 源 代码 文件 只 能 够 的 以 “#” 开 始 的 预 编译 指令 。 比 如 #include、#define 等 ， 主 要 处 理 规则 如 下 所 述 。 





(1) 将 所 有 的 #define 删 除 ， 并 且 展 开 所 有 的 宏 定义 ， 如 : 


#define a b 

















对 于 这 种 伪 指 令 ， 预 编译 所 要 做 的 是 将 程序 中 的 所 有 a 用 b 蔡 换 ， 但 作为 字符 串 常量 的 a 则 不 被 蔡 换 。 还 有 #undef， 则 将 取消 对 某 个 宏 的 定义 ， 使 以 后 该 串 的 出 现 不 再 被 替换 。 
(2) 处 理 所 有 条 件 预 编译 指令 ， 比 如 #if、#ifdef、#elif、#else、#endif。 
这 些 伪 指 令 的 引入 使 得 程序 员 可 以 通过 定义 不 同 的 宏 来 决定 编译 程序 对 哪些 代码 进行 处 理 。 预 编译 程序 将 根据 有 关 的 文件 ， 将 那些 不 必要 的 代码 过 滤 掉 。 


(3) 处 理 #include 预 编译 指令 ， 将 被 包含 的 文件 插入 到 该 预 编译 指令 的 位 置 。 注 意 : 这 个 过 程 是 递归 进行 的 ， 也 就 是 说 被 包含 的 文件 可 能 还 包含 其 他 文件 。 









































在 头 文件 中 一 般 用 伪 指 令 #define 定 义 大 量 的 宏 (最 常见 的 是 字符 常量 ) ， 同 时 包含 有 各 种 外 部 符号 的 声明 。 采 用 头 文件 的 目的 主要 是 为 了 使 某 些 定义 可 以 供 多 个 不 同 的 cpp 源 程序 使 用 。 因 为 在 需要 
到 这 些 定义 的 cpp 源 程序 中 ， 只 需 加 上 一 条 #include 语 句 即 可 ， 而 不 必 再 在 此 文件 中 将 这 些 定义 重复 一 遍 。 预 编译 程序 将 把 头 文件 中 的 定义 统统 都 加 入 到 它 所 产生 的 输出 文件 中 ， 以 供 编译 程序 对 之 进行 外 
理 。 包 含 到 cpp 源 程序 中 的 头 文件 可 以 是 系统 提供 的 ， 这 些 头 文件 一 般 被 放 在 /usr/include 目 录 下 。 在 程序 中 #include 它 们 时 要 使 用 尖 括 号 (<>) 。 另 外 开发 人 员 也 可 以 定义 自己 的 头 文件 ， 这 些 文件 一 般 










































































与 源 程序 放 在 同一 目录 下 ， 此 时 在 #include 中 要 用 双 引 号 ("") 。 





(4) 过 滤 所 有 的 注释 “//” 和 “/*/” 中 的 内 容 。 














(5) 添加 行 号 和 文件 名 标识 ， 比 如 #2 "test.c"2， 以 便于 编译 时 编译 器 产生 调试 用 的 行 号 信息 及 用 于 编译 时 产生 编译 错误 或 警告 时 能 够 显示 行 号 。 

















(6) 保留 所 有 的 #pragma 编 译 器 指令 ， 因 为 编译 器 需要 使 用 它们 。 














经 过 预 编译 后 的 .文件 不 包含 任何 宏 定 义 ， 因 为 所 有 的 宏 已 经 被 展开 ， 并 且 包 含 的 文件 也 已 经 被 插入 到 .文件 中 。 所 以 当 无 法 判断 宏 定义 是 否 正 确 或 头 文件 包含 是 否 正 确 时 ， 可 以 查看 预 处 理 后 的 文件 来 


确定 问题 。 


2. 编 译 


编译 过 程 就 是 把 预 处 理 完 的 文件 进行 一 系列 的 词法 分 析 、 语 法 分 析 、 语 义 分 析 以 及 优化 后 产生 相应 的 汇编 代码 文件 ， 这 个 过 程 往往 是 整个 程序 构建 的 核心 部 分 ， 也 是 最 复杂 的 部 分 之 一 。 上 面 的 编译 过 


程 相当 于 如 下 命令 : 








g++ -S helloworld.i -o helloworld.s 






































可 以 使 用 vi 直接 查看 helloworld.s 里 的 汇编 代码 。 图 4-2 只 截取 了 汇编 代码 的 一 小 部 分 以 作 展 示 。 其 中 ，-5 的 编译 选项 ， 表 示 只 执行 到 源 代码 到 汇编 代码 的 转换 ， 输 出 汇编 代码 。 注 











而 不 是 小 写 s， 因 为 大 小 写 s 的 编译 选项 表示 含义 都 是 不 一 样 的 ，-s 表 示 直 接生 成 与 运用 strip 同 样 效果 的 可 执行 文件 (删除 了 所 有 符号 信息 ) 。 











RÀ, 





这 里 是 用 大 写 S， 








user]#ë vi hellowor: 
bon ; E oworld. cpp 
local ES | ioinit 
C Om EL  ioinit,1,1 
section . IOdata 


string "hello world" 
"IET AE 

.qlobl main 
-type main, Bfunction 


main: 

-LEBSSY: 
„Cfi startproc 
.CÍi personality 
Pushd *rbp 
.CIi def 
c cfi ， pÍ Eset js 
ILC CT 
.cfi def 
moy t 


mov] ZSt4cout, tedi 


图 4-2 ”helloworld.s 里 的 部 分 汇编 代码 

















究竟 编译 器 做 了 什么 ?从 最 直观 的 角度 来 讲 ， 编 译 器 就 是 将 高 级 语言 翻译 成 机 器 语言 的 一 个 工具 。 比 如 可 以 用 C/C++ 语言 写 的 一 个 程序 可 以 使 用 编译 





























过 程 一 般 分 为 6 步 : 扫描 (词法 分 析 ) 、 语 法 分 析 、 语 义 分 析 、 源 代码 优化 、 代 码 生成 和 目标 代码 优化 ， 整 个 过 程 如 图 4-3 所 示 。 

















器 将 : 








翻译 成 机 器 可 以 执行 的 指 





令 及 数据 。 编 译 的 





— rÆ E 
词法 分 析 A 单词 ( token) 








目标 代码 CE 中 间 语 言 KREE E 








图 4-3 ”编译 过 程 示意 图 














接 下 来 将 结合 图 4-3 来 简单 描述 从 源 代 码 到 最 终 目 标 代码 的 过 程 ， 下 面 以 一 段 很 简单 的 C 语 义 的 代码 为 例子 ， 比 如 有 一 行 C 语 义 的 源 代码 如 下 ， 来 详细 说 明 编 译 的 过 程 。 

















array[index]=(index+5)* (247) ; 








(1) 词法 分 析 。 








首先 源 代码 程序 被 输入 到 扫描 器 ， 扫 描 器 的 任务 很 简单 ， 它 只 是 简单 地 进行 词法 分 析 ， 运 用 一 种 类 似 于 有 限 状态 机 的 算法 可 以 很 轻松 地 将 源 代码 的 字符 序列 分 割 成 一 系列 的 记号 。 比 如 示例 的 那 行 程 
序 ， 总 共 包 含 了 28 个 非 空 字符 ， 经 过 扫描 后 ， 产 生 了 16 个 记号 ， 如 表 4-1 所 示 。 








表 4-1 词法 分 析 结 果 


单词 (token) 类 型 
array bil 
[ ERW 
index 标识 符 


] 石 方 括号 


IR TH 


Lara 


ba 




















词法 分 析 产 生 的 记号 一 般 可 分 为 如 下 几 类 : 关键 字 、 标 识 符 、 字 面 量 (包含 数字 、 字 符 串 等 ) 和 特殊 记号 (如 加 号 、 等 号 ) 。 在 识别 记号 的 同时 ， 扫 描 器 也 完成 了 其 他 工作 。 比 如 将 标识 符 存 放 到 符 
表 中 ， 将 数字 、 字 符 串 常量 存放 到 文字 表 等 ， 以 备 后 面 的 步骤 使 用 。 


















































有 一 个 叫 lex 的 程序 可 以 实现 词法 扫描 ， 它 会 按照 用 户 之 前 描述 好 的 词法 规则 将 输入 的 字符 串 分 割 成 一 个 个 记号 。 





另外 对 于 一 些 有 预 处 理 的 语言 (如 C 语 言 ) ， 它 的 宏 蔡 换 和 文件 包含 等 工作 一 般 不 归 入 编译 器 的 范围 而 交 给 一 个 独立 的 预 处 理 器 。 








(2) 语法 分 析 。 











接 下 来 语法 分 析 器 将 对 由 扫描 器 产生 的 记号 进行 语法 分 析 ， 从 而 产生 语法 树 。 整 个 分 析 过 程 采用 了 上 下 文 无 关 文法 的 分 析 手 段 。 简 单 地 讲 ， 由 语法 分 析 器 生成 的 语法 树 就 是 以 表达 式 为 节点 的 树 。 我 们 
知道 ，C 语 言 的 一 个 语句 是 一 个 表达 式 ， 而 复杂 的 表达 式 由 很 多 表达 式 组 合 。 它 在 经 过 语法 分 析 器 以 后 形成 如 图 4-4 所 示 的 语法 树 。 
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图 4-4 语法 树 














从 图 4-4 可 以 看 到 ， 整 个 语句 被 看 作 一 个 赋值 表达 式 : 赋值 表达 式 的 左边 是 一 个 数组 表达 式 ; 它 的 右边 是 一 个 乘法 表达 式 ， 数组 表达 式 又 由 两 个 符号 表达 式 组 成 ， 等 等 。 符 号 和 数字 是 最 小 的 表达 式 ， 它 
们 不 是 由 其 他 的 表达 式 来 组 成 的 ， 所 以 通常 为 整个 语法 树 的 叶 节 点 。 在 语法 分 析 的 同时 ， 很 多 运算 符 的 优先 级 和 含义 也 被 确定 下 来 。 比 如 乘法 表达 式 的 优先 级 比 加 法 高 ， 而 圆 括号 表达 式 的 优先 级 比 乘法 高 
等 等 。 如 果 出 现 了 表达 式 不 合法 ， 比 如 各 种 括号 不 匹配 、 表 达 式 中 缺少 操作 符 等 ， 编 译 器 就 会 报告 语法 分 析 阶段 的 相关 错误 。 
































语法 分 析 也 有 一 个 现成 的 工具 叫 yacc， 它 也 像 lex 一 样 ， 可 以 根据 用 户 给 定 的 语法 规则 对 输入 的 记号 序列 进行 解析 ， 从 而 构建 一 棵 语法 树 。 











(3) 语义 分 析 。 








语义 分 析 是 由 语义 分 析 器 完成 。 语 法 分 析 仅 仅 是 完成 了 对 表达 式 的 语法 层面 的 分 析 ， 但 是 它 并 不 了 解 这 个 语句 是 否 真正 有 意义 。 比 如 对 C 语 言 里 面 两 个 指针 做 乘法 运算 是 没有 意义 的 ， 但 是 这 个 语句 在 
语法 上 是 合法 的 。 编 译 器 所 能 分 析 的 语义 是 静态 语义 。 所 谓 静态 语义 是 指 在 编译 期 间 可 以 确定 的 语义 。 与 之 对 应 的 动态 语义 就 是 只 有 在 运行 期 间 才 能 确定 的 语义 。 














静态 语义 通常 包括 声明 和 类 型 的 匹配 及 类 型 的 转换 等 。 比 如 当 一 个 浮 点 型 的 表达 式 赋值 给 一 个 整 型 的 表达 式 时 ， 其 中 隐 含 了 一 个 浮 点 型 赋值 给 一 个 指针 的 时 候 ， 语 义 分 析 程 序 会 发 现 这 个 类 型 不 匹配 ， 
编译 器 将 会 报错 。 








动态 语义 一 般 指 在 运行 期 间 出 现 的 语义 相关 的 问题 ， 比 如 将 0 作为 除数 是 一 个 运行 期 语义 错误 。 











经 过 语义 分 析 阶 段 后 ， 整 个 语法 树 的 表达 式 都 被 标识 了 类 型 ， 如 果 有 些 类 型 需要 做 隐 式 转化 ， 语 义 分 析 程序 会 在 语法 树 中 插入 相应 的 转换 节点 。 上 面 描述 的 语法 树 在 经 过 语义 分 析 阶 段 以 后 成 为 了 如 
4-5 所 示 的 形式 。 
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图 4-5 语义 分 析 后 的 语法 树 





可 以 看 到 ， 每 个 表达 式 (包括 符号 和 数字 ) 都 被 标识 了 类 型 。 在 示例 中 几乎 所 有 的 表达 式 都 是 整 型 的 ， 所 以 无 需 做 转换 。 
语义 分 析 器 还 对 符号 表 里 的 符号 类 型 也 做 了 更 新 。 


(4) 中 间 语 言 的 生成 。 








现代 的 编译 器 有 着 很 多 层次 的 优化 ， 往 往 在 源 代码 级 别 会 有 一 个 优化 过 程 。 这 里 所 描述 的 源码 级 优化 器 在 不 同 编译 器 中 可 能 会 有 不 同 的 定义 或 一 些 其 他 差异 。 源 代码 优化 器 会 在 源 代码 级 别 进行 优化 。 
在 示例 中 ， 可 以 发 现 ， (2+7) 这 个 表达 式 可 以 被 优化 掉 ， 因 为 它 的 值 在 编译 期 间 就 可 以 被 确定 。 





经 过 优化 的 语法 树 如 图 4-6 所 示 。 
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E4-6 ”优化 后 的 语法 树 








可 以 看 到 (2+7) 这 个 表达 式 被 优化 成 9。 其 实 直接 在 语法 树 上 进行 这 类 优化 比较 困难 ， 所 以 源 代 码 优化 器 往往 将 整个 语法 树 转换 成 中 间 代 码 ， 它 是 语法 树 的 顺序 表示 ， 其 实 它 已 经 非常 接近 目标 代码 
了 。 但 是 中 间 代 码 一 般 跟 目标 机 器 和 运行 时 环境 是 无 关 的 ， 比 如 不 包含 数据 的 尺寸 、 变 量 的 地 址 和 寄存 器 的 名 字 等 。 中 间 代码 有 很 多 种 类 型 ， 在 不 同 的 编译 器 中 有 着 不 同 的 形式 ， 比 如 三 地 址 码 等 。 








中 间 代 码 使 得 编译 器 可 以 被 分 成 前 端 和 后 端 。 编 译 器 前 端 负责 产 生机 器 无 关 的 中 间 代 码 ， 编 译 器 后 端 则 负责 将 中 间 代 码 转换 成 目标 机 器 代码 。 这 样 对 于 一 些 可 以 跨 平台 的 编译 器 而 言 ， 它 们 可 以 针对 不 
同 的 平台 使 用 同一 个 前 端 和 针对 不 同 的 机 器 平台 的 数 个 后 端 。 














(5) 目标 代码 的 生成 与 优化 。 





源 代码 级 优化 器 产生 中 间 代 码 标志 着 下 面 的 过 程 都 属于 编译 器 后 端 。 编 译 器 后 端 主要 包括 代码 生成 器 和 目标 代码 优化 器 。 





代码 生成 器 将 中 间 代 码 转换 成 目标 机 器 代码 ， 这 个 代码 十 分 依赖 于 目标 机 器 ， 因 为 不 同 的 机 器 有 着 不 同 的 字 长 、 寄 存 器 、 整 数 数据 类 型 和 浮 点 数 数据 类 型 等 。 


对 于 示例 的 中 间 代码 ， 代 码 生成 器 可 能 生成 下 面 的 代码 序列 : 





movl index, $ecx ; value of index 
addl $5, $ecx ; ecx-ecxt5 
mull $9, $ecx ; ecx-ecx*9 


movl index, $eax ; value of index to eax 
movl $ecx, array(,eax,5); array[index]-ecx 

















最 后 目标 代码 优化 器 对 上 面目 标 代 码 进行 优化 ， 比 如 选择 合适 的 寻 址 方式 、 使 用 位 移 来 代 蔡 乘 法 等 。 





经 过 了 扫描 (词法 分 析 ) 、 语 法 分 析 、 语 义 分 析 、 源 代码 优化 、 目 标 代码 生成 和 目标 代码 优化 ， 编 译 器 经 过 这 么 多 步骤 ， 源 代码 终于 被 编译 成 了 目标 代码 。 但 是 这 个 目标 代码 中 有 一 个 问题 : index 和 
array 的 地 址 还 没有 确定 。 如 果 现 在 把 目标 代码 使 用 汇编 器 编译 成 真正 能 够 在 机 器 上 执行 的 指令 ， 那 么 index 和 array 的 地 址 从 哪里 得 的 呢 ? 如 果 index 和 array 定 义 在 跟 上 面 的 源 代码 同一 个 编译 单元 里 面 ， 那 
么 编译 器 可 以 为 index 和 array 分 配 空间 ， 确 定 它们 的 地 址 ， 但 如 果 是 定义 在 其 他 的 程序 模块 中 呢 ? 



































事实 上 ， 定 义 其 他 模块 的 全 局 变量 和 函数 在 最 终 运 行 时 的 绝对 地 址 都 要 在 最 终 链接 的 时 候 才能 确定 。 所 以 现代 的 编译 器 可 以 将 一 个 源 代码 文件 编译 成 一 个 未 链接 的 目标 文件 ， 然 后 由 链接 器 最 终 将 这 些 














目标 文件 链接 起 来 形成 可 执行 文件 。 


3 链接 




















把 每 个 源 代码 模块 独立 地 编译 ， 然 后 按照 要 将 它们 “组 装 ” 起 来 ， 这 个 组 装 模 块 的 过 程 就 是 链接 。 链 接 的 主要 内 容 就 是 把 各 个 模块 之 间 相 互 引用 的 部 分 都 处 理 好 ， 使 得 各 个 模块 之 间 能 够 正确 的 衔接 。 























但 从 原理 上 讲 ， 它 的 工作 无 非 就 是 把 一 些 指令 对 其 他 符号 地 址 的 引用 加 以 修正 。 链 接 过 程 主要 包括 了 地 址 和 空间 分 配 、 符 号 决议 和 重 定位 等 这 些 步骤 。 














最 基本 的 静态 链接 过 程 如 图 4-7 所 示 。 每 个 模块 的 源 代码 文件 (如.c 文 件 ) 经 过 编译 器 编译 成 目标 文件 (如 .0 文件 ) ， 目 标 文 件 和 库 一 起 链接 形成 最 终 可 执行 文件 。 而 最 常见 的 库 就 是 运行 时 库 ， 它 是 支 
持 程序 运行 的 基本 函数 集合 。 
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库 其 实 就 是 一 组 目标 文件 的 包 ， 就 是 一 些 最 常用 的 代码 编译 成 目标 文件 后 打包 存放 。 



































在 链接 过 程 中 ， 对 其 他 定义 在 目标 文件 中 的 函数 调用 的 指令 需要 被 重新 调整 ， 对 实用 其 他 定义 在 其 他 目标 文件 的 变量 来 说 ， 也 存在 同样 问题 。 























结合 具体 的 CPU 指令 来 深入 了 解 这 个 过 程 。 假 设 有 个 全 局 变量 var， 它 在 目标 文件 A 中 。 当 要 在 目标 文件 B 里 面 要 访问 这 个 全 局 变量 ， 如 有 这 么 一 条 指令 : 





movl $0x2a, var 




















这 条 指令 就 是 给 这 个 var 变 量 赋值 0x2a， 相 当 于 C 语 言 中 的 语句 var=42。 然 后 编译 目标 文件 B， 得 到 这 条 指令 机 器 码 ， 如 图 4-8 所 示 。 








C705 00 00 00 00 2a 00 00 00 





目标 地 址 


图 4-8 ”赋值 指令 机 器 码 


由 于 在 编译 目标 文件 B 的 时 候 ， 编 译 器 并 不 知道 变量 var 的 目标 地 址 ， 所 以 编译 器 在 没 法 确定 地 址 的 情况 下 ， 将 这 条 mov 指 令 的 目标 地 址 设 为 0， 等 待 链接 器 在 将 目标 文件 A 和 B 链 接 起 来 的 时 候 再 将 其 修 
正 。 假 设 A 和 B 链 接 完成 后 ， 变 量 var 的 地 址 确定 下 来 为 0xX1000， 那 么 链接 器 将 会 把 这 个 指令 的 目标 地 址 部 分 修改 成 0x10000。 这 个 地 址 修正 的 过 程 也 叫 作 重 定位 ， 每 个 要 被 修正 的 地 方 叫 一 个 重 定位 入 口 。 






































每 个 目标 文件 除了 拥有 自己 的 数据 和 二 进 制 代码 外 ， 还 提供 了 3 个 表 : 未 解决 符号 表 、 导 出 符号 表 、 地 址 重 定向 表 ， 具 体 如 下 所 述 : @ 未 解决 符号 表 提供 了 所 有 在 该 编译 单元 里 引用 但 是 定义 并 不 是 在 本 
编译 单元 的 符号 以 及 其 出 现 的 地 址 ;，@ 导 出 符号 表 提 供 了 本 编译 单元 具有 定义 ， 并 且 愿 意 提供 给 其 他 单元 使 用 的 符号 及 其 地 址 ，@ 地 址 重 定向 表 提 供 了 本 编译 单元 所 有 对 自身 地 址 的 引用 的 记录 。 




















































































































编译 器 将 extern 声 明 的 变量 置 入 未 解决 符号 表 ， 而 不 置 入 导出 符号 表 。 这 属于 外 部 链接 。 

















于 内 部 链接 。 


xt 
H 








编译 器 将 static 声 明 的 全 局 变量 不 置 入 未 解决 符号 表 ， 也 不 置 入 导出 符号 表 ， 因 此 其 他 单元 无 法 使 用 。 


























普通 变化 及 其 函数 被 置 入 导出 符号 表 。 


(1) 静态 链接 。 











链接 分 为 静态 链接 和 动态 链接 。 对 函数 库 的 链接 是 放 在 编译 时 期 完成 的 是 静态 链接 。 所 有 相关 的 目标 文件 与 牵涉 到 的 函数 库 被 链接 合成 一 个 可 执行 文件 。 程 序 在 运行 时 ， 与 函数 库 再 无 瓜葛 ， 因 为 所 有 
需要 的 函数 已 复制 到 相关 位 置 。 这 些 函 数 库 被 称 为 静态 库 ， 通 常 文 件 名 为 “libxxx.a” 的 形式 。 





























下 面 通过 例 4.1 向 大 家 演示 下 ， 该 怎样 编译 和 使 用 静态 链接 库 。 

















【 例 4.1】 ”编译 和 使 用 静态 链接 库 。 














有 这 样 的 5 个 文件 : add.h、add.cpp、sub.h、sub.cpp 和 main.cpp， 各 自 代码 如 下 所 示 。 


add.h: 





#ifndef _ADD H_ 
#define ADD H 

int add(int a, int b); 
#endif 





add.cpp: 





#include "add.h" 
int add(int a, int b){ 
return atb; 


} 


sub.h: 


#ifndef _SUB H 
#define SUB H- 

int sub(int a, int b); 
#endif 





sub.cpp: 





#include "sub.h" 
int sub(int a,int b){ 
return a-b; 


} 





main.cpp: 





#include "add.h" 

#include "sub.h" 

#include "iostream" 

using namespace std; 

int main(){ 
cout<<"1+2="<<add (1, 2) ««endl; 
cout««"1-2-"««sub (1, 2) ««endl; 
return 0; 


} 





1) 先 将 add.cpp 和 sub.cpp 编 译 成 .o 文 件 ， 代 码 如 下 : 





g++ -c add.cpp 
g++ -c sub.cpp 








生成 的 文件 add.o sub.o，-c 的 编译 选项 ， 表 示 只 执行 到 编译 ， 输 出 目标 文件 ， 如 图 4-9 所 示 。 











无 论 是 静态 库 文件 还 是 动态 库 文件 ， 都 是 由 .o 文 件 创建 的 。 











2) 由 .o 文 件 创 建 静态 库 (.a 文 件 ) ， 执 行 命令 : ar cr libmymath.a sub.o add.o， 会 生成 ibmymath.a 文 件 ，ar 命 令 显示 库 文 件 中 的 .o 文 件 如 图 4-10 所 示 。 











üBlinux 
tBlinux c 


sub. t 
| -Ëlinux j | 
[rootBlinux charpterü4] 
add.cpp T id.o mai "bp sub.cpp sub.h, sub. 
[rootBlinux charpter04]j dil 





图 4-9 ” 例 4.1 编 译 生 成 .o 文 件 
[rootlinux charptero4] i ar Lb ibmymath.a 
rw-r--r-— DJ/U j20 oct 17 22:15 2015 add.o 


Eu D/O j20 OcL 17 22 5 24015 sub.o 














4-10” 例 4.1ar 命 令 显 示 库 文件 中 的 .0 文件 








库 文 件 的 命名 规范 是 以 lib 开 头 (BUE) ， 紧 接着 是 静态 库 名 ,以 .a 为 后 缀 名 。 








al 命令 的 r 选 项 : 在 库 中 插入 模块 (替换 ) 。 当 插入 的 模块 名 已 经 在 库 中 存在 ， 则 替换 同名 的 模块 。 如 果 若干 模块 中 有 一 个 模块 在 库 中 不 存在 ，ar 会 显示 一 个 错误 消息 ， 并 不 替换 其 他 同名 模块 。 默 认 的 
情况 下 ， 新 的 成 员 增 加 在 库 的 结尾 处 ， 可 以 使 用 其 他 任 选 项 来 改变 增加 的 位 置 。 
































al 命令 的 c 选 项 : 创建 一 个 库 。 不 管 库 是 否 存 在 ， 都 将 创建 。 





顺便 介绍 下 ar 的 tv 参数 ，ar tv libxxx.a， 可 以 显示 库 文件 中 有 哪些 目标 文件 ， 显 示 文件 名 、 时 间 、 大 小 等 详细 信息 。 


























3) 在 程序 中 使 用 静态 库 ， 执 行 命令 g++-o main main.cpp-L-Imymath， 会 生成 main 文 件 。 
























































静态 库 制作 完了 ， 要 使 用 它 内 部 的 函数 ， 只 需要 在 使 用 到 这 些 公用 函数 的 源 程序 中 包含 这 些 公用 函数 的 原型 声明 ， 然 后 再 用 g+ + 命令 生成 目标 文件 时 指明 静态 库 名 (是 mymath 而 不 是 
libmymath.a) ，g++ 将 会 从 静态 库 中 将 公用 函数 连接 到 目标 文件 中 。 注 意 ，g+ + 会 在 静态 库 名 前 加 上 前 缀 lib， 然 后 追加 扩展 名 .a 得 到 的 静态 库 文件 名 来 查找 静态 库 文件 。 在 程序 main.cpp 中 就 包含 了 静态 
库 的 头 文件 add.h 和 sub.h， 然 后 在 主 程序 main 中 直接 调用 公用 函数 add () 和 sub () 即 可 。 

























































































4) 生成 目标 程序 main， 执 行 main 文 件 ， 输 出 的 结果 如 下 所 示 : 


142-3 
1-2-3 


(2) 动态 链接 。 


除了 静态 链接 ， 也 可 以 把 对 一 些 库 函 数 的 链接 载 入 推迟 到 程序 运行 时 期 (runtime) ， 这 就 是 动态 链接 库 (dynamic link library) 技术 。 动 态 库 文件 名 命名 规范 和 静态 库 文件 名 命名 规范 类 似 ， 也 是 在 
动态 库 名 增加 前 缀 lib， 但 其 文件 扩展 名 为 .so0。 例 如 : 将 创建 的 动态 库 名 为 mymath 后 ， 则 动态 库 文件 名 就 是 ibmymath.so。 下 面 通过 实际 的 例子 向 大 家 演示 下 ， 该 怎样 编译 和 使 用 动态 链接 库 。 






































还 是 采用 上 面 例 4.1 中 的 add.h、add.cpp、sub.h、sub.cpp 和 main.cpp， 文 件 内 容 一 致 ， 键 入 以 下 命令 得 到 动态 库 文件 ibmamath.so。 可 以 用 以 下 命令 : 

















g++ -fPIC -o add.o -c add.cpp 
gt* -fPIC -o sub.o -c sub.cpp 
g++ -shared -o libmymath.so add.o sub.o 


也 可 以 直接 一 条 命令 搞定 : 


g++ -fPIC -shared -o libmymath.so add.cpp sub.cpp 





逐步 生成 动态 库 文件 的 过 程 如 图 4-11 所 示 。 
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4-11 逐步 生成 动态 库 文 件 




















常用 的 编译 参数 对 应 的 功能 如 下 所 述 。 





-fPIC: 表示 编译 为 位 置 独立 的 代码 。 不 用 此 选项 的 话 编译 














后 的 代码 是 位 置 相关 的 ， 所 以 动态 载 入 时 是 通过 代码 复制 的 方式 来 满足 不 同 进程 的 需 


， 而 不 能 达到 真正 代码 段 共享 的 目的 。 
-Lpath: 表示 在 path 目 录 中 搜索 库 文件 ， 如 -L. 则 表示 在 当前 目录 。 





-lpath: 表示 在 path 目 录 中 搜索 头 文件 。 





-ltest: 编译 器 查找 动态 连接 库 时 有 隐 含 的 命名 规则 ， 即 在 给 出 的 名 字 前 














面 加 lib ， 后 面 加 上 .so 来 确定 库 的 名 称 。 














在 程序 中 隐 式 使 用 动态 库 和 使 用 静态 库 完 
生成 目标 文件 ， 再 运行 它 看 看 结果 ， 代 码 如 下 : 












































一 样 ， 也 是 在 使 用 到 这 些 公 用 函数 的 源 程 序 中 包含 这 些 公 
































函数 的 原型 声明 ， 然 后 














g++ 命 令 对 生成 目标 文件 时 指明 的 动态 库 名 进行 编译 。 先 运行 9+ + 命令 


g++ -o main main.cpp -L. -lmymath 
./main 








链接 时 是 正常 的 ， 但 是 执行 的 时 候 则 报错 了 ， 提 示 ./main: error while loading shared libraries: libmymath.so: cannot open shared object file: No such file or directory, 如 


[root@linux ju: 








到 4-12 所 示 。 





-shared -o libmymath. 


add.o main.cpp  sub.h 
libmymath.so  sub.cpp sub.o 
ülinux CHASE 0 


j]£f 可 二 二 -o main main.cpp -L. 
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4-12” 找 不 到 动态 库 时 会 提示 的 错误 
错误 提示 说 明 是 找 不 到 动态 库 文件 ibmymath.so。 程 序 在 运行 时 ,会 在 /usr/lib 和 /lib 等 























录 中 查找 需要 的 动态 库 文件 。 若 找到 ， 则 载 入 动态 库 ， 否 则 将 提示 类 似 上 述 错误 而 终止 程序 运行 
动态 库 的 搜索 路 径 搜索 的 先后 顺序 是 : @@ 编 译 目标 代码 时 指定 的 动态 库 搜索 路 径 ; @ 环 境 变量 LD_LIBRARY_PATH 指 定 的 动态 库 搜索 路 径 ; @@ 配 置 文件 /etc/ld.so.conf 中 指定 的 动态 库 搜索 路 径 ; 
在 在 该 文件 中 追加 一 行 库 所 在 的 完整 路 径 如 "/root/test/conf/lib" 即 可 ， 然 后 ldconfig 是 修改 生效 ，@ 默 认 的 动态 库 搜索 路 径 /lib，@ 默 认 的 动态 库 搜索 路 径 /usr/lib。 


























为 此 解决 步骤 为 : @ 将 文件 ibmymath.so 复 制 到 























3&/usr/libeR: cp libmymath.so/usr/lib/; @ 修 改 环境 变量 LD_LIBRARY_PATH， 





体 的 命令 是 : 








export LD LIBRARY PATH-/usr/lib:$LD LIBRARY PATH 
sudo ldconfig 





修改 了 环境 变量 后 ， 就 可 以 顺利 执行 了 ， 如 图 4-13 所 示 。 
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图 4-13 ”修改 动态 库 的 环境 变量 


(3) 动态 库 与 静态 库 重 名 问题 。 




















还 是 采用 上 面 的 add.h、add.cpp、sub.h、sub.cpp 和 main.cpp， 文 件 内 容 一 致 ， 执 行 以 下 命令 : 








g++ -c add.cpp 

g++ -c sub.cpp 

ar cr libmymath.a add.o sub.o 

g++ -shared -fPIC -o libmymath.so add.cpp sub.cpp 








程序 执行 完 后 会 同时 生成 动态 库 与 静态 库 ， 如 图 4-14 所 示 。 








现在 目录 有 2 个 同名 的 库 文件 (动态 库 文件 和 静态 库 文 件 同名 ) : libmymath.a 和 libmy-math.so。 编 译 运 行程 序 ， 提 示 ./main: error while loading shared libraries: libmymath.so: cannot open 
shared object file: No such file or directory。 也 就 是 动态 库 文 件 和 静态 库 文 件 同名 的 时 候 ， 编 译 器 会 先 到 path 目 录 下 搜索 libxxx.so 文 件 ， 如 果 没有 找到 ， 则 继续 搜索 libxxx.a (静态 库 ) 。 

















idad.cpp 

. sub.cpp 

ar cr libmymath.a add.o sub.o 

g++ -shared -fPIC -o libmymath.so add.cpp 


sub.cpp 
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444 同时 生成 动态 库 和 静态 库 








(4) 静态 链接 库 、 动 态 链接 库 各 自 的 特点 。 


1) 动态 链接 库 有 利于 进程 间 资 源 共享 。 























当 某 个 程序 在 运行 中 要 调用 某 个 动态 链接 库 函 数 的 时 候 ， 操 作 系统 首先 会 查看 所 有 正在 运行 的 程序 ， 看 在 内 存 里 是 否 已 有 此 库 函 数 的 拷贝 了 。 如 果 有 ， 则 让 其 共享 那 一 个 拷贝 ， 只 有 没有 时 才 链接 载 
入 。 这 样 的 模式 虽然 会 带 来 一 些 “ 动 态 链接 ”额外 的 开销 ， 却 大 大 节省 了 系统 的 内 存 资源 。C 语 言 的 标准 库 就 是 动态 链接 库 ， 也 就 是 说 系统 中 所 有 运行 的 程序 共享 着 同一 个 C 语 言 标准 库 的 代码 段 。 而 静态 链 
接 库 则 不 同 ， 如 果 系 统 中 多 个 程序 都 要 调用 某 个 静态 链接 库 函 数 时 ， 则 每 个 程序 都 要 将 这 个 库 函 数 拷贝 到 自己 的 代码 段 中 ， 这 显然 将 占有 更 大 的 内 存 资源 。 
















































































2) 将 一 些 程序 升级 变 得 简单 。 用 静态 库 ， 如 果 库 发 生变 化 ， 使 用 库 的 程序 要 重新 编译 ; 使 用 动态 库 ， 只 要 动态 库 提 供给 该 程序 的 接口 没 变 ， 只 要 重新 用 新 生成 的 动态 库 蔡 换 原来 就 可 以 了 。 





























3) 甚至 可 以 真正 做 到 链接 载 入 完全 由 程序 员 在 程序 代码 中 控制 。 





程序 员 在 编写 程序 的 时 候 ， 可 以 明确 的 指明 什么 时 候 或 者 什么 情况 下 ， 链 接 载 入 哪个 动态 链接 库 函 数 。 你 可 以 有 一 个 相当 大 的 软件 ， 但 每 次 运行 的 时 候 ， 由 于 不 同 的 操作 需求 ， 只 有 一 小 部 分 程序 被 载 
入 内 存 。 但 若 所 有 的 函数 本 着 “有 需求 才 调 入 ”的 原则 ， 则 可 以 大 大 节省 系统 资源 。 比 如 现在 的 软件 通常 都 能 打开 若干 种 不 同类 型 的 文件 ， 这 些 读 写 操作 通常 都 用 动态 链接 库 来 实现 ， 在 一 次 运行 当中 ， 一 
般 只 有 一 种 类 型 的 文件 将 会 被 打开 。 所 以 直到 程序 知道 文件 的 类 型 以 后 再 载 入 相应 的 读 写 函 数 ， 而 不 是 一 开始 就 将 所 有 的 读 写 函 数 都 载 入 ， 然 后 才 发 觉 在 整个 程序 中 根本 没有 用 到 它们 造成 低 效 。 

































































4) 由 于 静态 库 在 编译 的 时 候 ， 就 将 库 函 数 装载 到 程序 中 去 了 ， 而 动态 库 函 数 必须 在 运行 的 时 候 才 被 装载 ， 所 以 程序 在 执行 的 时 候 ， 用 静态 库 速度 更 快 些 。 















































在 编译 C/C++ 代 码 的 时 候 ， 有 人 用 gcc， 有 人 用 g+ + ， 于 是 各 种 说 法 都 来 了 ， 璧 如 C 代 码 用 gcc， 而 c++ 代码 用 g+ + ， 或 者 说 编译 用 gcc， 链 接 用 g+ + ， 一 时 也 不 知 哪个 说 法 正确 ， 如 果 再 遇 上 个 
extern"C"， 分 歧 就 更 多 了 。 这 节 就 简单 讲 讲 这 二 者 的 区 别 与 联系 。 












































(1) 误 





Dx 


—: gcc 只 能 编译 C 代 码 ，g+ + 只 能 编译 c+ + 代码 。 事 实 上 ， 两 者 都 可 以 ， 但 是 请 注意 ， 以 下 几 点 。 





1) 后 缀 为 .< 的 ，gcc 把 它 当 作 是 C 程 序 ， 而 9++ 当 作 是 C++ 程序 ; 后缀 为 .cpp 的 ， 两 者 都 会 认为 是 C+ + 程序 ， 注 意 ， 虽 然 C+ + 是 C 的 超 集 ， 但 是 两 者 对 语法 的 要 求 是 有 区 别 的 ， 例 如 : 








#include<stdio.h> 
int main(int argc,char* argv[]){ 


if (argv==0) return; 

printString (argv); 

return; 
} 
int printString(char* string) { 

sprintf (string, "This is a test.\n"); 
} 











如 果 按 照 C 语 言 的 语法 规则 ， 是 没有 问题 的 ， 但 一 旦 把 后 缀 改 为 cpp， 立 刻 报 两 个 错 : “printstring 未 定义 ”和 “return-statement with no value”， 如 图 4-15 所 示 。 
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可 见 C++ 的 语法 规则 更 加 严谨 一 些 。 






































int ' 


int' 


2) 编译 阶段 ，g+ + 会 调用 gcc， 对 于 C++ 代码 ， 两 者 是 等 价 的 ; 但 是 因为 gcc 命 令 不 能 自动 和 C++ 程 序 使 用 的 库 链接 ， 所 以 通常 用 g++ 来 完成 链接 ， 为 了 统一 起 见 ， 干脆 编 译 / 链 接 统统 用 g++ 了 ， 这 





就 给 人 一 种 错觉 ， 好 像 cpp 程 序 只 能 用 g++ 似 的 。 


(2) 误区 二 : gcc 不 会 定义 _cplusplus 宏 ,而 g++ 会 。 














实际 上 ， 这 个 宏 只 是 标志 着 编译 器 将 会 把 代码 按 C 还 是 C+ + 语法 来 解释 ， 如 上 所 述 ， 如 果 后 缀 为 <， 并且 采 














gcc 编 译 器 ， 则 该 宏 就 是 未 定义 的 ， 否 则 就 是 已 定义 。 



































(3) 误区 三 : 编译 只 能 用 gcc， 链 接 只 能 用 g++。 









































严格 来 说， 这 句 话 不 算 错 误 ， 但 是 它 混淆 了 概念 ， 应 该 这 样 说 : 编译 可 以 用 gcc/g++， 而 链接 可 以 用 g++ 或 者 gcc-lstdc++。 因 为 gcc 命 令 不 能 自动 和 C+ + 程序 使 用 的 库 链接 ， 所 以 通常 使 用 g++ 来 完 





















































成 链接 。 但 在 编译 阶段 ，g+ + 会 自动 调用 gcc， 二 者 等 价 。 








(4) 误区 四 : extern"C" 与 gcc/g++ 有 关系 。 





实际 上 并 无 关系 ， 无 论 是 gcc 还 是 g++， 用 extern"C" 时 ， 都 是 以 C 的 命名 方式 来 为 syymbol 命 名 ; 否则 ， 都 以 C++ 方 式 命 








【 例 4.2】 ”使 用 extern"C" 编 译 程序 。 














me.h 的 代码 是 : 
extern "C" void CppPrintf (void); 


me.cpp 的 代码 是 : 





#include<iostream> 

#include"me.h" 

using namespace std; 

void CppPrintf (void) { 
cout««"Hello"««endl; 

} 


test.cpp 的 代码 是 : 


finclude"me.h" 

int main(){ 
CppPrintf(); 
return 0; 


} 








先 给 me.h 加 上 extern"C"， 看 用 gcc 和 g++ 命名 有 什么 不 同 。 执 行 以 下 命令 : 














g++ -S me.cpp 
less me.s 


可 以 看 到 结果 是 


.globl CppPrintf 
.type  CppPrintf, Gfunction 


执行 以 下 命令 : 


gcc -S me.cpp 





less me.s 





可 以 看 到 结果 是 : 





.globl CppPrintf 
.type  CppPrintf, Gfunction 











也 就 是 说 ， 加 上 了 extern"C" 后 ，CppPrintf 这 个 函数 用 g++ 和 gcc 编 译 得 到 的 函数 命名 是 一 样 的， 都 是 以 C 的 命名 方式 。 再 把 me.h 的 extern"C" 去 掉 。 执 行 以 下 命令 : 














g++ -S me.cpp 
less me.s 





可 以 看 到 结果 是 : 





-globl Z9CppPrintfv 
.-type | Z9CppPrintfv, Gfunction 


执行 以 下 命令 : 





gcc -S me.cpp 
less me.s 





可 以 看 到 结果 是 : 





-globl Z9CppPrintfv 
‘type | Z9CppPrintfv, Gfunction 

















也 就 算 说 ， 去 掉 了 extern"C" 后 ，CppPrintf 函 数 用 g+ + 和 9cc 编 译 得 到 的 函数 命名 是 一 样 的 ， 都 是 以 C++ 的 命名 方式 。 可 见 extern "C "与 采用 gcc/g+ -3f76X FS. 











4.2 makefile 的 摆 写 

















一 个 工程 中 的 源 文件 不 计数 ， 其 按 类 型 、 功 能 、 模 块 分 别 放 在 若干 个 目录 中 ， 如 何 更 高 效率 地 编译 整个 工程 ， 需 要 用 到 makefile 和 make 命 令 工具 。makefile 中 会 定义 一 系列 的 规则 ， 指 定 哪些 文件 需 
先 编译 ， 哪 些 文件 需要 后 编译 ， 哪 些 文件 需要 重新 编译 ， 甚 至 于 进行 更 复杂 的 功能 操作 。 









































makefile 带 来 的 好 处 就 是 “自动 化 编译 ”， 一 旦 写 好 ， 只 需要 一 个 make 命 令 ， 整 个 工程 完全 自动 编译 ， 极 大 地 提高 了 软件 开发 的 效率 。make 命 令 是 一 个 命令 工具 ， 是 一 个 解释 makefile 中 指令 的 命令 
工具 ,一 般 来 说 ， 大 多 数 的 IDE 都 有 这 个 命令 ， 比 如 : Delphi 的 make 命 令 ，Visual C++ 的 nmake 命 令 ，Linux 下 GNU 的 make 命 令 等 。 可 见 ， 利 用 makefile 进 行 编译 ， 已 成 为 了 一 种 在 工程 方面 的 常见 编译 
方法 。 














会 不 会 写 makefile， 可 以 从 一 个 侧面 说 明 一 个 人 是 否 具备 完成 大 型 工程 的 能 力 。 因 为 ，makefile 关 系 到 了 整个 工程 的 编译 规则 。 











makefile 就 像 一 个 shell 脚 本 一 样 ， 其 中 也 可 以 执行 操作 系统 的 命令 。 








下 面 将 用 一 个 示例 来 说 明 makefile 的 书写 规则 。 











【 例 4.3】 makefile 书 写 规则 举例 。 
准备 3 个 文件 : file1.h，file1.cpp，file2.cpp。 


f ile1.h 的 代码 是 : 





#ifndef FILE1 HB 
#define FILEl H- 
#ifdef _ cplusplus 
extern "C" { 
#endif 
void FilelPrint(); 
#ifdef _ cplusplus 
l 
fendif 
fendif 





file1.cpp 的 代码 是 : 





#include <iostream> 
#include "filel.h" 
using namespace std; 
void FilelPrint()( 
cout<<"Print filel*eeceeccecooceeooee t ccendl; 


} 





file2.cpp 的 代码 是 : 





#include <iostream> 

#include "filel.h" 

using namespace std; 

int main (){ 
cout««"Print file2*eeeceecceeooceeoeee t ccendl; 
FilelPrint(); 
return 0; 





makefile 文 件 是 : 





helloworld:filel.o file2.o 

g++ filel.o file2.o -o helloworld 
file2.0:file2.cpp 

g++ -c file2.cpp -o file2.o 
filel.o:filel.cpp filel.h 


yt+ -c filel.cpp -o filel.o 


clean: 
rm -rf *.o helloworld 





可 见 ， 一 个 makefile 主 要 含有 一 系列 的 规则 ， 如 下 所 示 : 








每 个 命令 行 前 都 必须 有 tab 符 号 。 上 面 的 makefile 文 件 目的 就 是 要 编译 一 个 helloworld 的 可 执行 文件 ， 接 下 来 一 句 一 句 来 解释 。 


helloworld 依 赖 file1.o file2.o 两 个 目标 文件 : 





helloworld : filel.o file2.o 








编译 出 helloworld 可 执行 文件 ，-o 后 面 加 你 指定 的 目标 文件 名 : 














g++ filel.o file2.0 -o helloworld 





file2.o 依 赖 file2.cpp 文 件 : 





file2.0:file2.cpp 





下 面 是 编译 出 file2.o 文 件 。-c 表 示 g+ + 只 把 给 它 的 文件 编译 成 目标 文件 ， 用 源码 文件 的 文件 名 命名 但 把 其 后 缀 由 “.c” Bü "cc" 或 “.cpp” 变 成 “.o”。 在 这 句 中 ， 可 以 省 略 -o file2.o， 编 译 器 默认 44 








成 file2.o 文 件 ， 这 就 是 -c 的 作 















































g++ -c file2.cpp -o file2.0 





编译 出 file1.o 文 件 : 





filel.o:filel.cpp filel.h 


yt+ -e filel.cpp -o filel.o 














当 用 户 键入 "make clean" 命 令 时 ， 会 删除 *.o 和 helloworld 文 件 。 写 好 makefile 文 件 ， 在 命令 行 中 直接 键入 make 命 令 ， 就 会 执行 makefile 中 的 内 容 了 : 











clean: 
rm -rf *.o helloworld 












































到 这 步 大 家 都 能 轻松 编译 一 个 helloworld 程 序 了 。 再 上 一 层 楼 ， 下 面 来 学 学 怎么 使 用 变量 。 可 以 看 到 ， 上 面 有 很 多 g+ + ， 其 实 可 以 把 它 写 到 一 个 变量 里 。 一 个 使 用 变量 的 makefile 如 例 4.4 所 示 。 














【 例 4.4】 ”在 makefile 中 使 用 变量 。 




















OBJS = filel.o file2.0 
XX = g++ 

CFLAGS = -Wall -0 -g 
helloworld : $(OBJS) 


$ (XX) $ (OBJS) -o helloworld 
file2.0 : file2.cpp filel.h 

$(XX) $ (CFLAGS) -c file2.cpp -o file2.o 
filel.o : filel.cpp filel.h 

$(XX) S(CFLAGS) -c filel.cpp -o filel.o 


Clean: 
rm -rf *.o helloworld 





执行 make 命 令 后 提示 : 





gtt -Wall -O -g -c filel.cpp -o filel.o 
g++ -Wall -O -g -c file2.cpp -o file2.0 
g++ filel.o file2.o -o helloworld 





并 生成 了 helloworld 文 件 。 











这 里 应 用 到 了 变量 。 要 设 定 一 个 变量 ， 只 要 在 一 行 的 前 端 写 下 这 个 变量 的 名 字 ， 后 面 跟 一 个 “ 








变量 名 即 可 。 


CFLAGS--Wall-O-g: 配置 编译 器 设置 ， 并 把 它 赋 值 给 CFLAGS 变 量 ， 其 中 每 个 部 分 含义 为 : 



































M 


”号 ， 后 面 跟 要 设 定 的 这 个 变量 的 值 即 可 。 以 后 要 引用 这 个 变量 ， 只 写 一 个 “$” 符 号 ， 后 面 是 在 括号 里 








G-Wall: 输出 所 有 的 警告 信息 ; Q-O: 编译 时 进行 优化 ; ©-9: 表示 编译 debug 版 本 。 


这 样 写 的 makefile 文 件 比较 简单 ， 但 很 容易 就 会 发 现 其 缺点 ， 那 就 是 要 列 出 所 有 的 文件 。 如 果 添 加 一 个 文件 ， 那 就 需要 修改 一 次 makefile 文 件 ， 这 在 实际 项 目 开 发 中 还 是 比较 麻烦 的 。 











其 实 这 就 是 编程 序 ， 只 不 过 








的 语言 不 同 而 已 。 接 下 来 ， 将 介绍 如 何在 makefile 里 使 用 





【 例 4.5】 在 makefile 里 使 用 函数 。 





CC = gcc 
XX = g++ 
CFLAGS = -Wall -0 -g 
TARGET = helloworld 


$.0: $.c 


$(CC) S$(CFLAGS) -c $< -o $8 


$.0:$. 


p 
$ (XX) $ (CFLAGS) -c $< -o $8 


SOURCES = $(wildcard *.c *.cpp) 
OBJS = $(patsubst $.c,$.0,$(patsubst $.cpp,$.o, $ (SOURCES) ) ) 


$ (TARGET) : $(OBJS) 


rm -rf *.o helloworld 


) 
$ (XX) $(OBJS) -o S(TARGET) 





执行 make 命 令 输 出 : 





gt -Wall -O -g -c filel.cpp -o filel.o 
g++ -Wall -O -g -c file2.cpp -o file2.o 
g++ filel.o file2.o -o helloworld 












































在 makefile 规 则 中 ， 通 配 符 会 被 自动 展开 。 但 在 变量 的 定义 和 函数 引用 时 ， 通 配 符 将 失效 。 这 种 情况 下 如 果 需 要 通 配 答 有 效 ， 就 需要 使 用 函数 wildcard， 它 的 用 法 是 : 






































$ (wildcard PATTERNhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...) 在 makefile 中 ， 它 被 展开 为 已 经 存在 的 、 使 
空格 分 开 的 、 匹 配 此 模式 的 所 有 文件 列表 。 如 果 不 存在 任何 符合 此 模式 的 文件 ， 函 数 会 忽略 模式 字符 并 返回 空 。 需 要 注意 的 是 : 这 种 情况 下 的 规则 中 通配符 的 展开 和 上 一 小 节 匹 配 通配符 是 有 区 别 的。 下 
面 这 一 行 表示 产生 一 个 所 有 以 .<、.cpp 结 尾 的 文件 的 列表 ， 然 后 存 入 变量 SOURCES 里 。 












































SOURCES = $(wildcard *.c *.cpp) 























patsubst 函 数 ， 用 于 匹配 替换 ， 有 3 个 参数 。 第 一 个 是 一 个 需要 匹配 的 式样 ， 第 二 个 表示 用 什么 来 蔡 换 它 ， 第 三 个 是 一 个 需要 被 处 理 的 由 空格 分 隔 的 列表 ， 比 如 : 





























$(patsubst $.c,$.0,$ (dir) ) 











是 指 用 patsubst 把 $ (dir) 中 的 变量 符合 后 缀 是 .c 的 全 部 替换 成 .0。 而 下 面 这 一 行 代码 ， 则 表示 把 文件 列表 中 所 有 的 .c、.cpp 字 符 变 成 .0， 形 成 一 个 新 的 文件 列表 ， 然 后 存 入 OBJS 变 量 中 。 




















OBJS = $(patsubst $.c,$.0,$(patsubst $%.cpp,%.o,$ (SOURCES))) 





这 几 句 命令 表示 把 所 有 的 .c、.cpp 文 件 编译 成 .0 文件 。 








$ (CFLAGS) -c $< -o $@ 


$.0:$. 


cpp 
$ (XX) $ (CFLAGS) -c $< -o $8 














这 里 有 3 个 比较 有 用 的 内 部 变量 : @$@ 扩 展 成 当前 规则 的 目的 文件 名 ; @$ < 扩展 成 依靠 列表 中 的 第 一 个 依靠 文件 ，@@ 而 $^ 扩 展 成 整个 依靠 的 列表 ( 除 掉 了 里 面 所 有 重复 的 文件 名 ) 。 























到 这 里 就 已 经 能 够 编写 一 个 比较 简单 、 通 用 的 makefile 文 件 了 ， 需 要 注意 的 是 上 面 所 有 的 例子 都 假定 所 有 的 文件 都 在 同一 个 目录 下 ， 不 包含 子 目 录 。 























43 目标 文件 

















Ri 








前 面 已 经 多 次 提 到 目标 文件 ， 究 竟 目 标 文件 是 什么 ? ELF 是 一 种 用 于 二 进 制 文件 、 可 执行 文件 、 目 标 代码 、 共 享 库 和 核心 转 储 的 标准 文件 格式 。 ELF 标 准 的 目的 是 为 软件 开发 人 员 提 供 一 组 二 进 制 接 
义 ， 这 些 接口 可 以 延伸 到 多 种 操作 环境 中 ， 从 而 减少 重新 编码 、 编 译 程序 的 需要 。 















































UNIX 最 早 的 可 执行 文件 格式 为 a.out 格 式 ， 它 的 设计 非常 地 简单 ， 以 至 于 后 来 当 共 享 库 这 个 概念 出 现 的 时 候 ，a.out 格 式 就 变 得 捉 襟 见 时 了。 于 是 人 们 设计 了 COFF 格 式 标准 来 解决 这 些 问题 ， 这 个 设计 
非常 通用 。 而 ELF 正 是 从 COFF 继 承 来 的 。 


















































COFF 的 主要 贡献 是 在 目标 文件 里 面 引入 了 “ 段 ” 的 机 制 ， 不 同 的 目标 文件 可 以 拥有 不 同 数量 及 不 同类 型 的 “ 段 ”。 另 外 ， 它 还 定义 了 调试 数据 格式 。 ELF 格 式 比 COFF 更 具 可 扩展 性 与 灵活 性 ， 被 用 来 
取代 COFF。 现 在 ，ELF 的 使 用 已 经 非常 广泛 了 。 



































44 本 章 小 结 


本 章 讲述 了 编译 与 链接 、 自 动 化 编译 利器 makefile 的 使 用 、 目 标 文件 及 其 相关 工具 等 相关 知识 ， 掌 握 这 些 知识 后 ， 你 就 已 经 具备 了 完成 大 型 功能 开发 的 能 力 了 。 


程序 编译 成 功 后 ， 还 需要 进行 调试 ， 第 5 章 将 开始 学 习 如 何 调试 。 


在 理想 世界 里 ， 每 当 一 个 程序 不 能 正常 执行 某 个 功能 时 ， 它 就 会 给 出 一 个 有 用 的 错误 提示 ， 告 诉 开 发 者 足够 的 改正 错误 的 线索 。 但 遗憾 的 是 ， 在 现实 世界 中 ， 很 多 时 候 一 个 程序 出 现 了 问题 时 却 无 法 找 
到 原因 。 这 就 是 调试 程序 出 现 的 原因 。 


调试 的 方法 一 般 有 2 种 ， 如 下 所 述 。 
(1) 在 程序 中 插入 打印 语句 ， 优 点 是 能 够 显示 程序 的 动态 过 程 ， 比 较 容 易 检 查 源 程序 的 有 关 信息 。 缺 点 是 效率 低 ， 可 能 输入 大 量 无 关 的 数据 ， 发 现 错误 具有 偶然 性 。 
(2) 借助 调试 工具 。 目 前 大 多 数 程序 设计 语言 都 有 专门 的 调试 工具 ， 比 如 C++ 的 调试 工具 有 GDB， 可 以 用 这 些 工具 来 分 析 程 序 的 动态 行为 。 


本 章 主 要 讲 一 些 调试 工具 ， 方 便 读 者 更 高 效率 地 进行 调试 。 


5.1 strace 











1. 系 统 调 









































为 了 为 创建 文件 、 进 程 和 复制 文件 等 这 些 操作 系统 提供 的 服务 ， 应 用 程序 必须 和 操作 系统 之 间 进 行 交互 。 但 是 ， 应 用 程序 是 不 能 直接 访问 Linux 内 核 的 。 它 既 不 能 访问 内 核 所 占 内 存 空间 ， 也 不 能 调用 内 
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Ed 




















码 会 告诉 内 核 进程 正在 请 求 哪 种 服务 。 然 后 ， 它 查看 系统 调用 表 ， 找 到 所 调用 的 内 核 函 数 入 口 地 址 ， 调 



























































核 函数 。 不 过 ， 应 用 程序 可 以 跳 转 到 system_call 的 内 核 位 置 ， 内 核 会 检查 系统 调用 号 ， 这 个 号 








数 ， 然 后 返回 到 进程 。 

































































所 有 操作 系统 在 其 内 核 都 有 一 些 内 建 的 函数 ， 这 些 函 数 可 以 用 来 完成 一 些 系统 级 别 的 功能 ， 一 般 称 Linux 系 统 上 的 这 些 函 数 为 “系统 调用 ” (system call) 。 这 些 函 数 代表 了 用 户 空间 到 内 核 空间 的 一 种 






































转换 ， 例 如 ， 在 用 户 空间 调用 open 函 数 ， 在 内 核 空间 则 会 调用 sys_open。 









































系统 调用 的 错误 码 : 系统 调用 并 不 直接 返回 错误 码 ， 而 是 将 错误 码 放 入 一 个 名 为 errno 的 
消息 定义 在 errno.h 中 ， 你 也 可 以 通过 命令 "man 3 errno" 来 查看 它们 。 





























局 变量 中 。 如 果 一 个 系统 调用 失败 ， 你 可 以 读 出 errno 的 值 来 确定 问题 的 所 在 。errno 不 同 数值 所 代表 的 错误 




















需要 注意 的 是 ，errno 的 值 只 在 函数 发 生 错 误 时 设置 ， 如 果 函 数 不 发 生 错误 ，errno 的 值 就 无 定义 ， 并 不 会 被 置 为 0。 另 外 ， 在 处 理 errno 前 最 好 先 把 它 的 值 存 入 另 一 个 变量 ， 因 为 在 错误 处 理 过 程 中 ， 即 


使 像 printf () 这 样 的 函数 出 错时 也 会 改变 errno 的 值 。 



































而 strace 就 是 一 个 通过 跟踪 系统 调用 来 让 开发 者 知道 一 个 程序 在 后 台所 做 事情 的 工具 。 











2.strace 初 识 























先 来 用 一 个 简单 的 程序 来 演示 strace 的 基本 用 法 ， 如 例 5.1 所 示 。 























【 例 5.1】 ”输入 一 个 数 ， 并 输出 这 个 数 。 


#include <iostream> 
using namespace std; 
int main(){ 
int a; 
cin>>a; 
cout««a««endl; 
return 0; 

















然后 用 g+ +-o test test.cpp 编 译 一 下 ， 得 到 一 个 可 执行 文件 test， 执 行 结果 如 图 5-1 所 示 。 




















[sharexuglinux 
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图 5-1 


050115 ./t 

















执行 ./test 命 令 得 到 的 结果 


















































输入 了 一 个 数 8， 也 输出 了 一 个 数 8。 然 后 用 strace 调 用 执行 ， 得 到 的 结果 如 图 5-2 和 图 5-3 所 示 。 



































每 一 行 都 是 一 次 系统 调用 ， 等 号 左边 是 系统 调用 的 函数 名 及 其 参数 ， 右 边 是 该 调用 的 返回 值 。 从 strace 结 果 可 以 看 到 ， 系 统 首先 调用 execve， 以 开始 一 个 新 的 进行 ， 接 着 进行 一 些 环境 的 初始 化 操作 ， 





















































最 后 停顿 在 read (0) 上 面 ， 这 也 就 是 执行 到 了 cin 函 数 后 ， 等 待 用 户 输入 数字 。 在 输入 完 “8” 之 后 ， 再 调 











过 程 。 
接 下 来 再 选择 部 分 结果 来 做 详细 分 析 : 


execve("./test", ["./test"], [/* 22 vars */]) = 0 


对 于 命令 行 下 执行 的 程序 ，execve (或 exec 系 列 调用 中 的 某 一 个 ) 均 为 strace 输 出 系统 调 


Fs (这 里 为 ./test) 。 


























write 函 数 将 格式 化 后 的 数值 8 输出 到 屏幕 ， 最 后 调用 exit_group 退 出 进行 ， 完 成 整个 程序 的 执行 












































中 的 第 一 个 。strace 首 先 调 用 fork 或 clone 函 数 新 建 一 个 子 进程 ， 然 后 在 子 进程 中 调用 exec 载 入 需要 执行 的 程 


























[sharexieli 

EXxerve|"./test", ["./test"], [Ar* 22 vars sr - B 

brki(a = Bxl4sfBOO 

[Ir EEG EBENE 4096, PROT _ READ FROT WRITE, MAP PRIVATE|MAP ANONYMOUS, 1. B) = BDx7fad2deTffonü 
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close{3] =H 
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mmapiMLL. 26338012. PROT READIPROT EXEE, MAP PRIVATE |MAP DEMYWRITE. 3. B) = BüxTfoa2d7575068 
mprüatecti(gxz7fulzdzdacOO, 2093056, PROT MONE) = 8 

pmnapidxzio42dudBBBB, 2192, PROT_READ| PROT_WRITE, MAP_PRIYATE|MAF_FIXED|MAP_DENYWRITE, 3, 8xB2BOO] = Gx7f9 
ald adaga 

close{3] = 

pihent" libes Libgce < 5.50, 1L", 0 ADIMLY] = 3 

road(3, "ALPTELF* 2AT 1A "BE Ei EN I .BR = Bd2 

fstatiz, {st mede-5 IFREG| B755, st size-00784, ,1.1] - B 

maafin, 4056, PROT READB[PHOT WRITE, MAP PRIVATE|MAP AMDGHTHMDUS, -1, B) = Bx7fad2deTBOUn 

pmapiMULL. 218648B, PROT READIPRDT EXEC, MAP PRIUATE|MAP DEMYWRITE, 3, By = Bx/fO42d541888 
mprotectioxefo42d5s7000. 2093056. PROT NOME) = 8 

pmaniGx;T542d75560D0, 4066, PROT READ|PROT WRITE, MAP PRIVATE|MAP FIXED|MAP DEHYWRITE, 3, üx15000] = tify 
RI EE 

rlnse(3] 

npeni"/lib64/libr.sa.6^, O RDONLY] 

read(3, "XI77ELF*2*1*1^3^0 0 OVE, EP OP OCA, 20, 0 B TOP OA Op JS INBSEONDABT - - B33) = 232 

fstat(3, {st made-5 IFREG|BO/55, st size-18211/5, ...]] - H 

Eap 3758152. PROT READ|PRDT EXEC, MAP PRIVATE|MAP DEMYWRITE. 3. B) = BxTfo4d2dladbobO 
mprütectigx7fu420337000, 2097152, PROT NONE) 385] 

pmmapiGx/is42ds3;/BBB, 20486, PROT READ|PROÜT WRITE, MAP PRIVATE|MAP FIXED|MAP DENYWRITE, 3, BxlBaGGO] = x7 
faa2ds370068 

pmapiGx;TO42d53cBBD, 18696, PROT READIPROT WRITE, MAP PRIVATE[MAP FIXEDI|BAP ANDMYMOUS, -1, 8] = Ox; T842d5 
acpeo 

pd ETT EI EH 

mapiMLL. 488956, PROT READBIPROT WRITE. MAP PRIVATE|MAP ANONYHOUS. -1. & = Bx; fad2daT Bad 

D: Ent SEES B192, PROT FREAD FROT_WRITE, MAP PRIVATE [MAP ANDNYMI WS, -L 3 = EUxrfad2deTsOUdu 

arch p jre CLEAR ues TFS Gxyfüd2def5720] = 8 

rt HIORT 337000. 10304, PROT READ) = B 


图 5-2 ”执行 strace./test 命 令 得 到 的 结果 图 1 


mpratect loxrfo42]nd5n080B. 4006. PROT | READ] 一 f 

mmap(MAL. Auc, PROT HEAD|PROUT WRITE, MAP PHIVATE|MAP ANONYMOUS, -1, ü) = üGx7?TO4A2defa4opn 
mprotectiBxriSd2drc3BBB, zBG72, PRUT BEAD) = B 

mprarectiüx/T842dTODOBH, 4086, PROT READ] 

munmapi;B&x7:942defBBBB, 21866) =H 

fstat(B, {st made-5 IFOHR|6626, st rdew-makedsv[138, Gl. ...]j 

mmap NULL; 435, PRUT READ|PROT WRITE. MAP PRIVATE|MAP ANONYMOUS. -1. 8) = Bxrio4sdefeoon 
readíG. B 

"Bin, 1024] lI 

fstat(1. {st made-5 IFCHR|OG20, st rdev-makedev[136, 0], ...]) - B 

mmap NULL., 4955, PRDT READ|PROT WRITE, MAP PRIVATE|RMAP AMONYTMOUS, -1, 8) = BxiT9d2defrda388 
writa[l, "min", 28 

1 


exit groupio] 

图 5-3 ”执行 strace./test 命 令 得 到 的 结果 图 2 
brk(0) = Ox 
以 0 作为 参数 调用 brk， 返 回 值 为 内 存 管理 的 起 始 地 址 ( 若 在 子 进程 中 调用 malloc， 则 从 0x1787000 地 址 开始 分 配 空间 ) 。 


mmap (NULL, 4096, PROT READ|PROT WRITE, MAP PRIVATE|MAP ANONYM 





















































使 用 mmap 和 函数 进行 匿名 内 存 映射 ， 以 此 来 获取 4096Bytes 内 存 空间 ， 该 空间 起 始 地 址 为 0x7f97c2899000， 匿 名 内 存 映射 就 是 为 了 不 涉及 具体 的 文件 和 名， 避免 了 文件 的 创建 及 打开 ， 这 种 只 能 用 于 具有 
亲缘 关系 的 进程 间 通 信 。 关 于 进程 间 通 信和 后面 的 章节 会 有 详细 描述 ， 这 里 暂 不 展开 。 























access("/etc/ld.so.preload", R OK) = -1 ENOENT (No such file or directory) 











调用 access 函 数 检验 /etc/ld.so.preload 是 否 存 在 。 











open("/etc/ld.so.cache", O RDONLY) = 3 














调用 open 函 数 党 试 打开 /etc/ld.so.cache 文 件 ， 返 回 文件 描述 符 为 3。 














fstat(3, (st mode-S IFREG|0644, st size-21000, http://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...)]) = 0 











使 用 fstat 函 数 获取 /etc/ld.so.cache 文 件 信息 。 











mmap (NULL, 21000, PROT_READ, MAP PRIVATE, 3, 0) = 0x7f97c2893000 











调用 mmap 函 数 将 /etc/ld.so.cache 文 件 映射 至 内 存 。 











close(3) 





close 关 闭 文件 描述 符 为 3 指向 的 /etc/ld.so.cache 文 件 。 





open ("/usr/lib64/libstdc++.so.6", O RDONLY) = 3 
read (3, "\177ELF\2\1\1\0\0\0\0\0\0\0\0\0\3\0>\0\1\0\0\0\360c\5\0\0\0\0\0"http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15788/OEBPS/Text 





调用 open 和 read， 从 /usr/lib64/libstdc++.so.6 该 libc 库 文件 中 读 取 832Bytes， 即 读 取 ELF 头 信息 。 上 一 章 讲 到 目标 文件 的 ELF 头 部 中 有 进程 的 进入 点 ， 这 里 就 是 在 获得 进程 的 进入 点 。 





mprotect (0x7f97c245d000, 2097152, PROT NONE) = 0 














使 用 mprotect 函 数 对 0x7f97c245d000， 起 始 的 2097152Bytes 空 间 进行 保护 (PROT_NONE 参 数 就 是 不 能 访问 ， 对 应 还 有 PROT_READ 表 示 可 以 读 取 ) 。 








munmap (0x7f97c2893000, 21000) = 0 














调用 munmap 函 数 ， 将 /etc/Id.so.cache 文 件 从 内 存 中 去 映射 ， 与 下 面 这 行 的 mmap 对 应 。 








mmap (NULL, 21000, PROT READ, MAP PRIVATE, 3, 0) = 0x7f97c2893000 























对 应 源码 中 使 用 到 的 两 个 系统 调用 一 read 函数 ， 读 取 从 终端 输入 的 内 容 和 输出 内 容 到 终端 : 




















read(0, 8 

"BNn", 1024) -2 
write(1, "8\n", 28 

) =2 





子 进程 结束 ， 退 出 码 为 0。 





exit group(0) 








从 源码 看 来 ， 真 正 能 与 源码 对 应 上 的 只 有 read 和 write 这 两 个 系统 调用 ， 其 他 系统 调用 几乎 都 用 于 进行 进程 初始 化 工作 : 装载 被 执行 程序 、 载 入 libc 函 数 库 、 设 置 内 存 映射 等 。 























再 来 看 看 可 能 strace 到 的 常用 的 系统 调 




















有 错误 产生 时 ， 一 般 会 返回 -1， 所 以 会 有 错误 标志 和 描述 ， 例 如 : 





open (\\ "/for/barNV" ,) RDONLY) = -1 ENOENT (no such file or directory) 





这 个 表示 打开 /for/bar 文 件 错误 ， 后 面 的 描述 提示 是 没有 这 个 文件 。 











char* 将 作为 C 的 字符 串 类 型 输出 。 没 有 字符 串 输出 时 一 般 是 char*， 是 一 个 转 义 字符 ， 只 输出 字符 串 的 长 度 。 当 字符 串 过 长 时 会 使 用 \\" 部 分 字符 串 \\" 省 略 (如 在 \”ls-IN” 会 有 一 个 gepwuid 调 用 读 取 
password 文 件 ) : 














read(3, \\ “root::0:0:System Administrator:/NV" .…,1024) = 422 





当 参 数 是 结构 数组 时 ， 将 按照 简单 的 指针 和 数组 输出 ， 代 码 如 下 : 





getgroups (4, [0,2,4,5]) = 4 














关于 bit 作 为 参数 的 情形 ， 也 是 使 用 方 括 号 ， 并 且 用 空格 将 每 一 项 参数 隔 开 ， 代 码 如 下 : 





























sigprocmask (SIG BLOCK, [CHLD TTOU],[]) = 0 





这 里 第 二 个 参数 代表 两 个 信号 SIGCHLD 和 SIGTTOU。 如 果 bit 型 参数 全 部 置 位 ， 则 有 如 下 的 输出 ， 代 码 如 下 : 





sigprocmask (SIG UNBLOCK,~[],NULL) = 0 





这 里 第 二 个 参数 全 部 置 位 。 


3. 用 strace 来 跟踪 信号 传递 


还 可 以 用 strace 来 跟踪 信号 传递 。 这 里 还 是 使 用 例 5.1 的 那个 test 程 序 ， 来 观察 进程 接收 信号 的 情况 。 还 是 先 输 入 命令 “strace./test”， 等 待 的 时 候 不 要 输入 任何 东西 ， 然 后 打开 另外 一 个 窗口 ， 
"killall test”， 执 行 结果 如 图 5-4 和 和 图 5-5 所 示 。 


strace 中 的 结果 显示 test 进 程 “+++killed by SIGTERM+++”。 事 实 上 ,命令 killall test， 就 是 杀 死 所 有 名 为 test 的 进程 。 


4. 统 计 系 统 调用 


strace 不 光 能 追踪 系统 调用 ， 通 过 E 它 还 能 将 进程 所 有 的 系统 调用 做 一 个 统计 分 析 并 返回 。 下 面 就 来 看 看 strace 的 统计 ， 这 次 执行 带 -c 参 数 的 strace， 执 行 strace-c test 命 令 后 ， 能 得 


5-6 所 示 的 结果 


[sharexuglinux 0501 
= 0 
jxf9C665 
4036, PROT RE | PROT. WRITE, MAP PRIVATE|MAP ANONYMOUS, -1, 0) - Ox7fcblffbio00 
— retc/ld.so. prelo R OK) - -1 ENOENT (No such file or directory) 
open("/etc/1d.so.cache", E Y : 
fstat(3. (st mode-5 IFREG|0544 st size-21000. ...}) 2 0 
mmap (NULL, 21000, PROT READ, MAP PRIVATE, 3, 0) ~ Ox7fcblffab000 
open! "/usr/1lib64/libstdc. 50.6", 3 
read(3, 'X177ELFX2X 1N1X9N0X 8NOXO TN NO e^ -4ON140X0N0350c45X04010N010",.,, B32) = 822 
fstat(3, {st node-5 IFREG|9755, st Size~98 27095, mE 
mnar (NULL, 3166648 PROT READ|PROT EXEC, MAP PRIV 'ATE|MAP DENYWRITE, 3, 8) = aGx7fcbifaadoobn 
mprotect (Ox7fcb1fb75000, 2097152, PROT NOME) - zb 


输入 命 


到 如 图 


jx7fcb1fd75000, 36854, PROT READIPROT WRITE, MAP_PRIVA E[JMAP FIXED|MAP DENYWRITE, 3, QOxeBO00) = Ox?fcblfd753000 


fcbifd7e880, 82350, PROT READ|PROT WRITE, MAP PRIVATE|MAP FIXED|MAP ANONYMOUS, -1, ©) = Ox7icbifd7e0GG 


/Lib64/ libm.s0.6", 0_RDONLY 
"NIZ ZELF\2\ ATZO Igrog oezo ANS VBp>\e VBN9ABNBNG- 
{st n [3 | IFREG|0755, st siz8-596272, ..]1) 28 
. PROT | READ|PROT EXEC. MAP ' PRIVATEIMAP. DENVWRITE, 3. 8) = Ox7fcb1f805000 
900, 2053056, PROT NONE) = O 
3192, PROT READ|PROT WRITE, MAP PRIVATE|MAP FIXED|MAP DENYWRITE, 3, 9x820G0) = Ox7fcbifasbeco 


/lib64/libgcc s.so.1*', O0 RDONY) -3 
; CAlTZELFA2A1A1N8AGENOONOAGNDNG XGA ON INONONON20)AENONONONONO",,.., S32) - 832 
3 (st made-S IFRE |0755, st size-90784, ...}) = 0 
(NULL. 4036 PROT_READ PROT WRITE. MAP _ PRIVATE [MAP ANONYMOUS. -1. 0) = Ox7fcblffaa000 
(NULL, 2186488, PROT het PROT. EXEC, MAP PRIYATE IMAP DENYWRITE , 3, 8) = Ox7fcb1f5f3000 
(Ox7fcblfeoUcoo, NONE) = 8 
b1f868860, 4095, PROT _RE AD |PROT_WRITE. MAP PRIVATE|MAP FIXED|MAP DENYWRITE, 3, 8x15860) = Bx7fcb1lfa68996 


2 
i2 
" 
t 


("/lib64/libc. so. 6", 0 _RDONLY -3 
*X177F1 i AIX3AGVEXOVONONGNONONSNOAONTVONONOpA356N1X040394018"..., 832) = 822 
[st mode= S_TFREG|0755 st size-1921176. ...}) 2 Q 
3750152, PROT READ|PROT EXEC, MAP PRIVATE|MAP DENYWRITE, 3, 9) ~ Ox7fcbltf25f000 
wide 3x7 fcblf3e9200, 2087152, PROT NONE) = 0 
mmap [8x7 fcblf5e98260, 70480, PROT READ PROT WRITE, MAP_ PRIV TE|MAP FIXED|MAP DENYWRITE 3. 8OxlBa0080) = Ox7fcb1fí5e20 
mnap wn f5ee8000, 18596, PROT READ|PROT WRITE, MAP PRIVATE|MAP FIXED|MAP ANONYMOUS, -1, 0) = Ox7Íicblf5ee000 
close(3] -0 
mmap (NULL, 4996, PROT READ|PROT WRITE, MAP PRIVATE|MAP ANONYMOUS, -1, Ə) = Bx7fchb iffa9e60 
mmap (NULL. 8192 PROT READ|PROT WRITE. MAP PRIV TE|MAP ANONYMOUS. 2m A x7fcb1ffa7600 
arch prctl(ARCH SET FS, Ox7fcblffa7720) = 0 
mprotect(Gx7fcbifSegGGO0, 16384, PROT READ) = Ə 
mprotect(&x7fcblfaBbG60, 4096, PROT READ) = 6 
mnap NULL, 4096, PROT READ|PROT WRITE, MAP PRIVATE|MAP ANONYMOUS, -1, 0) = Ox7fcbiffaGo00 
mprotect iis fd7 Sassi 23 , PROT READ) - 9 
mprotect( 0 j, PROT READ) = 0 
i bif fab 060. 21008) 3 


图 5-4 strace 执 行 可 执行 文件 过 程 中 被 ki 掉 时 发 生 的 系统 调用 结果 图 1 


fstat(B，fst mode=5_IFCHR] 8620, st_rdev=makedev(135, 0). ...}) 

mmap (NALL, 4096, PROT_READ|PROT WRITE, MAP PRIVATE|MAP ANONYMOUS, -1, 80) = 8ex7fcbiffbob8G 
read(0, Ox7fcblffbo000, 1024) = ? ERESTARTSYS (To be restarted) 

-- SIGTERM {Terminated} @ 0 (9) --- 


++ killed by SIGTERM ++ 


5-5 sttace 执 行 可 执行 文件 过 程 中 被 kill 掉 时 发 生 的 系统 调用 结果 图 2 


09 





errors 


n,.oooooo 
O, JDE s 
6.000606 
9. 000000 


pa 
pi j ji md [Å (0 D. sd LITT CT] je LUI 


. 000000 
[s roel inus 0501] [] 


图 5-6 ”执行 strace-c 命 令 统 计 系 统 调 用 结果 图 














次 数 多 少 、 








司 5-6 显 示 ，test 程 序 一 共 调 用 了 5 次 read 函 数 、1 次 write 函数 等 ， 各 个 系统 函数 ， 调 


























情况 是 否 会 一 样 ， 下 面 就 来 验证 一 下 。 








如 果 例 5.1 中 的 cin 和 cout 都 换 成 了 C 中 的 scanf 和 printf， 那 么 其 系统 调 

















scanf 和 printf 输 入 一 个 数 ， 并 输出 这 个 数 。 











#include<stdio.h> 
int main(){ 


























printf (" id n" 2a) 
return 0; 
) 
还 是 用 g+ +-o test test.cpp 对 其 进行 编译 ， 用 strace-c 来 统计 其 系统 调用 次 数 ， 结 果 如 图 5-7 所 示 。 





















































C++ 的 cin 输 入 cout 输 出 和 C 的 scanf 输 入 printf 输 出 ， 用 到 的 系统 调用 数量 都 是 一 样 的 。 














如 图 5-7 中 所 示 ， 


























消耗 了 多 少时 间 等 这 些 信息 都 清晰 可 见 。 


syscall 


write 
open 
close 
fstat 
mmap 
mprotect 
munmap 
brk 
access 
execve 
arch prctl 





[sharexugalinux 0502] strace -c 


seconds usecs/call calls errors syscall 


0.000000 

0.900000 

0.000000 

0,000080 

0.000000 

| ,DODDOD 

. 000099 ; mprotect 
.DOOODO munmap 
.BD0008 | brk 

5. 000000 J access 
DODDDOD execve 

8.000000 arch prctl 


100.00 0.000000 
[sharexu@linux 050215 [| 

图 5-7 用 strace 统 计 scanf 输 入 printf 输 出 程序 发 生 的 系统 调用 结果 图 
5. 其 他 常用 选项 
除了 -Cc 参数 之 外 ，strace 还 提供 了 其 他 有 用 的 参数 ， 能 很 方便 地 得 到 自己 想 要 的 信息 ， 下 面 就 对 那些 常用 的 参数 一 一 介绍 。 


参数 -o 用 在 将 strace 的 结果 输出 到 文件 中 ， 如 果 不 指定 -o 参 数 的话 ， 上 默认 的 输出 设备 是 STDERR， 也 就 是 说 使 用 “-o filename” 和 “2>filename” 语 句 的 结果 是 一 样 的， 如 图 5-8 所 示 。 
[sharexuglinux 86581]€& strac 

B 

5 

[sharexugalinux O5801]$ stra: 


[Sharexuglinus 0501] 
[sharexuglinux 0561]: 


图 5-8 ”比较 strace 使 用 “-o filename" 4e "2»flename" 8425 X 
把 -o 指 定 的 输出 文件 test.txt 和 2>test2.txt 的 结果 做 比较 (用 diff 命 令 ) ， 可 以 看 到 两 个 文件 一 样 ， 也 就 是 说 这 两 个 命令 是 等 价 的 。 
strace 可 以 使 用 参数 -T 将 每 个 系统 调用 所 花费 的 时 间 打印 出 来 ， 每 个 调用 的 时 间 花 销 都 体现 在 调用 行 最 右边 的 尖 括 号 里 面 。 执 行 strace-T./test 可 以 得 到 如 图 5-9 所 示 (这 里 只 截取 了 前 面 几 行 ) 。 


[sharexiglinux 0501]$ strace -T ./test 
execve("./test", ["./test"], [/* 22 vars */]) = 9 <0.090096> 
brk (0) = 0x257c000 <0. 009008> 
mmap(NULL, 4096, PROT READ|PROT WRITE, MAP PRIVATE|MAP ANONYMOUS, -1, 0) = 9x7fP3d2e99690-|<9 
access ("/etc/ld.so.preload", R OX] = -1 ENOENT (No such file or directory)| «0.600610 
open(*/etc/ld.so.cache", CO RDONLY] = 3 «0.000613-7 
fstati3, {st mode-5 IFREG|0644, st size-21000, ...)) = 0 «6.000008» 
mmap(NULL, 21060, PROT READ, MAP PRIVATE, 3, ©) = 6x7f31d3e920600 «0.000910» 
close(3) = 0 <0. 000008> 
pen("/usr/lib64/libstdc+.so.6", O RDONLY) = 3 <0.000013> 


图 5-9 ”执行 strace- 工 命令 可 得 到 每 个 系统 调用 所 花费 的 时 间 





























结果 表示 ， 调 用 execve 冰 数 花 了 0.000096s， 调 用 mmap 函 数 花 了 0.000010s。 









































strace 的 -t、-tt、-ttt 参 数 则 是 记录 每 次 系统 调用 发 生 的 时 间 ， 分 别 精确 到 秒 、 微 秒 和 UNIX 时 间 戳 的 微 秒 。 执 行 strace-t./test 命 令 可 以 得 到 如 图 5-10 所 示 的 结果 (这 里 只 截取 了 前 面 几 行 ) 。 





























[/* 22 vars ' 


PROT  READ|PRDT WRITE, PRIVATE|MAP ANONYMOUS, -1, 0) = Ox7f9e4537e000 
sa preload”, R OK) = -1 ENOENT (No such file or directory) 
/ .cache", O _RDONLY) = 3 
fstat{3, {st mode=5 IFREG|8644, st size-21006, ...)) = € 
mmap (NULL, 308, PROT READ, MAP PRIVATE. 











由 图 5-10 可 知 ， 这 几 个 系统 调用 都 是 在 22: 34: 39 这 一 秒 内 发 生 的 。 
















































































strace 不 光 能 自己 初始 化 一 个 进程 进行 strace， 还 能 追踪 现 有 的 进程 ， 参 数 -p 就 是 取 这 个 作用 的 ， 用 法 也 很 简单 ， 具 体 如 下 : 





strace -p pid 





其 中 ，pid 是 指 进程 id。 











接 下 来 举 一 个 例子 看 看 怎么 用 strace 来 调试 程序 。 























strace 调 试 程序 。 








#include <iostream> 
#include <fstream> 
#include <stdlib.h> 
using namespace std; 
int main(){ 
char buffer[256]; 
ifstream in ("input.txt"); 
if (! in.is_open()){ 
cout << "Error opening file"<<endl; 
exit (1); 
} 
while (!in.eof()){ 
in.getline (buffer,100); 
cout << buffer << endl; 
} 
return 0; 


l 

















例 5.3 中 的 程序 是 从 当前 目录 下 的 input.txt 中 读 取 内 容 ， 然 后 把 它 输 出 。 当 执行 ./test 命 令 ， 结 果 如 图 5-11 所 示 。 


[sharexu@linux 8503] 


























Error opening file 


45-11. 55.94 HAT P8 E] 























结果 提示 Error opening file， 也 就 是 读 取 文件 时 出 现 了 异常 ， 那 究竟 是 什么 异常 呢 ， 我 们 可 以 继续 用 strace 来 定位 。 执 行 strace/test 命 令 后 ， 结 果 如 图 5-12 所 示 (只 截取 了 后 面部 分 ) . 














mmap(NULL, 4096, PROT READ|PROT WRITE, MAP PRIVATE|MAP ANONYMOUS, -1, 0 Ox7f9c4eb3500C 
mmap(NULL, 8192, PROT READ|PROT WRITE, MAP PRIYATE|MAP ANONYMOUS, -1, O) = Ox7f9c4eb3309€ 
arch prctl(ARCH SET FS. 0x7f9c4eb33720] = 0 
mprotect(Ox7f9c4e175000, 15384, PROT READ) 
mprotect(Ox7f9c4e617000, 4996, PROT READ) 
mmap (NU. L. 4996, PROT READ|PROT WRITE. MAP PRIVATE|MAP ANONYMOUS. -1. 0] = Ox7f9c4eb32086 

:901000, 28672, PROT READ) - O 

eb3e000, 4996, PROT READ) = € 
f8c4eb37000. 21000) = 日 
xaOBCO0 


open("input.txt". 0 RDONLY) = -=] NT (No such file or directory) 

fstatfi tst mude 392131574: st rdev=nakedevfti36 I, m} 

urs do L, 4096, PROT Digest i WRITE, MAP .PRIYATE|MAP _ ANONY ) , 0] = Ox7f9c4eb3co8Be 
"Error opening fileXn". lOFrror opening file 


exit qroup(1) 
[sharexu@linux 9593]$ [] 





图 5-12 ”用 strace 定 位 程序 读 取 文件 发 生 的 异常 





[sharexuglinux 9563]$ ll 
16 


Xr-X 


[EE N- | 


-rwxr- 


-'wW-F--r-- 1 
[sharexuglinux 











5-13 展 示 当 前 目录 只 有 test 和 test.cpp 两 个 文件 ， 没 有 input.txt 文 件 。 有 时 候 ， 


图 5-13 ”查看 当前 目录 的 结果 图 





当 你 百 思 不 得 其 解 的 时 候 ，strace 往 往 : 





D 





5.2 gdb 























gdb 是 gcc 的 调试 工具 ， 主 要 























E 
AE) 








其 中 “open ("input.txt", O RDONLY) =-1 ENOENT (No such file or directory) ”， 是 提示 没有 input.txt 文 件 ， 再 查看 当前 








录 ， 得 到 如 











图 











= 
HX 








大 ， 主 要 体现 在 以 下 4 点 : @ 启 动 程序 ， 可 以 按照 


的 断 点 处 停 住 ;@@ 当 程序 被 停 住 时 ， 可 以 检查 此 时 程序 中 运行 的 状态 ;@ 动 态 地 改变 程序 的 执行 环境 。 
































调试 C/C+ + 的 程序 ， 首 先 在 编译 时 ， 必 须要 把 调试 信息 加 到 可 执行 文件 中 。 使 用 编译 器 (cc/gcc/g+ +) 的 -9 参数 可 以 做 到 这 一 点 ， 如 下 代码 : 


gcc -g hello.c -o hello 
g++ -g hello.cpp -o hello 


如 果 没 有 -9g， 你 将 看 不 见 程序 的 函数 名 、 变 量 名 ， 所 代 蔡 的 全 是 运行 时 的 内 存 地 址 。 当 


启动 gdb 的 方法 : 
1) gdb program 
program 也 就 是 你 的 执行 文件 ， 一 般 在 当前 目录 下 。 


2) gdb program core 
































gdb 同 时 调试 一 个 运行 程序 和 core 文 件 ，core 是 程序 非法 执行 后 core dump 后 7 








3) gdb program 1234 








生 的 文件 。 























如 果 程序 是 一 个 服务 程序 ， 那 么 可 以 指定 这 个 服务 程序 运行 时 的 进程 ID，gdb 会 








1.gdb 常 用 用 法 




















接 下 来 将 结合 一 个 例子 来 看 gdb 的 常用 用 法 。 


[015.4] 。 斐 波 那 契 例子 。 


#include<iostream> 
using namespace std; 
int func (int n){ 
int result=0; 
for (int i=1;i<=n;i++){ 
result+=i; 
} 


return result; 


int main(){ 
int arr[10]; 
arr[0]20; 
arr[1]21; 
for (int i-2;i«10;i**)( 
arr[i]sarr[i-1]*arr[i-2]; 


cout««"arr[9]"««arr[9]««end1; 
cout««"func (9) "<<func (9) ««end1; 
return 0; 




















g* *-g-o test test.cpp 命 令 编译 程序 ， 注 意 这 里 要 加 上 -g。 程 序 的 执行 结果 如 
[sharexu(qalin 
— | EY 
arr[9j34 


func(9)45 





到 5-14 所 示 。 


L] 








动 进行 attach 操 作 ， 并 调试 这 个 程序 。 并 | 





-9 把 调试 信息 加 入 之 后 ， 并 成 功 编译 目标 代码 以 后 ， 让 我 们 来 看 看 如 何 


5-13 所 示 的 结果 。 





定义 的 要 求 随心 所 欲 地 运行 程序 ，@ 可 让 被 调试 的 程序 在 指定 














gdb 来 调试 它 。 


目 program 应 该 在 PATH 环境 变量 中 搜索 得 到 。 











加 5-14” 例 5.4 程 序 的 执行 结果 








接 下 来 用 gdb 调 试 程序 ， 输 入 gdb test 命 令 ， 启 动 gdb。 执 行 结果 如 图 5-15 所 示 。 


输入 ”1 “后 (命令 相当 于 list) ， 从 第 一 行 开始 列 出 源码 ， 结 果 如 图 5-16 所 示 。 


ee 

GMU gdb (GDB) Red Hat Enterprise Linux (7.2-60.el5 4.1) 
Copyright (C) 2018 Free Software Foundation, Inc. 
License GPLv2-: GNU GPL version 3 or later -http://gnu. org ‘licenses/gpl. htnl- 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GIE was configured as "x85 B&4-redhat-linux-gnu". 

For bug reporting instructions, please see; 

«http: //www.gnu.arg/saftware/gdb/bugs/-... 

Reading symbols from /home/sharexu/charpterG5/D504/test...done. 

(gdb) [] 


图 5-15 “开始 用 gdb 调 试 程序 时 会 输出 的 结果 


再 按 下 Enter 键 ， 表 示 重 复 上 一 次 命令 ， 结 果 如 图 5-17 所 示 。 


F 


func(int n)d 
int result=ġ: 
for(int i=1;is=n;1+}i 


resul t+=1: 


J 
return result; 


mainí]i 


int arr[18] .: 
arr[8]268: 


图 5-16 在 gdb 调 试 过 程 中 输入 1 时 展示 的 结果 





arr[1]=1:; 

for{int 1=-2;1+19:1++}{ 
arrlij=arr[i-1}+arr[i-2]: 

} 

cout«e"arr[93] "ssarr [9]««end1 : 

coute" Tunc (83) "exfunc [8) een dl : 

return ĝ; 


图 5-17 在 gdb 调 试 过 程 中 按 下 Enter 键 时 展示 的 结果 


执行 “b func”， 表 示 设 置 断 点 在 函数 func 入 口 处 ， 执 行 “info break”， 表 示 查 看 断 点 的 信息 ， 如 图 5-18 所 示 。 


(gdb) b 15 
Breakpoint 1 at 0x4008a7: file test.cpp, line 15. 
(gdb) b func 
Breakpoint 2 at OxdoO85b: file test.cpp, line 4. 
(gdb) info break 
Num Type Disp Enb Address What 
l breakpoint keep y — GxeoooooODOO48O0B8a/ Im mainl) at test.cpp:15 
2 breakpoint keep y  0x000020000040085b in func(int) at test.cpp:4 
(gdb) [] 
图 5-18 在 gdb 调 试 过 程 中 设置 断 点 


执行 "命令 ， 表 示 运 行程 序 ，run 命 令 简写 ， 如 图 5-19 所 示 。 


(gdb) r 
Starting program: /home/sharexu/charpter05/6504/test 

Breakpoint 1, main () at test.cpp:15 

15 arr[i]-arr[i-i]«arr[i-2]: 

Missing separate debuginfos, use: debuginfo-install glibc-2.12-1.149.el5 6.5.x86 64 libgcc-4.4.6-43.e16.x8 
6 64 libstdc--4.4. 6-4. e16. x86 64 

(gdo) [] 


图 5-19 ”在 gdb 调 试 过 程 中 运行 程序 


图 5-19 表 示 ， 程 序 停 在 了 断 点 处 。 


输入 “n”， 表 示 单 条 语句 执行 ，next 命 令 简写 ， 如 图 5-20 所 示 。 
for(int i=2:1<10:1+){ 


图 5-20 在 gdb 调 试 过 程 中 单条 执行 程序 


输入 “p i”“p arr[]”， 分 别 打印 变量 和 变量 arrf 的 值 ， 如 图 5-21 所 示 。 





P He LL ms | 


图 5-21 在 gdb 调 试 过 程 中 打印 变量 的 值 


输入 “bt”， 查 看 函数 堆栈 ， 如 图 5-22 所 示 。 


17 couteze"arr[8] '--arr[3]z«end] : 
igdb) 
arr[9]34 


cout««s" func (8) "z«func(8) ««endl; 


Breakpoint 2, func (n-B) at test.cpp:4 
4 int result-8: 

1gdb ) 

5 for(int i-1;ie-n;iceM 
lgdb) 

6 resultr-i; 

iadt ) 

S 

igdb} bt 
#0 func (n-8) at test.cpp:5 

71 OxBOObODODODO4ODDOd in main |) at test.cpp:18 
[gdb} 


for{int 1=] :1<—n - 1+}{ 


图 5-22 ”在 gdb 调 试 过 程 中 查看 函数 堆栈 
输入 “finish”， 退 出 函数 ， 如 图 5-23 所 示 。 


程序 结束 时 如 图 5-24 所 示 。 





(gdb) finish 

Run till exit from #0 func (n=9) at test.cpp:5 
oxODOOOOO0DO4OO0BO0d in main () at test.cpp:18 

18 cout«z" func(9) "««func(8) ««endl; 
Value returned is $3 = 45 


图 5-23 ”在 gdb 调 试 过 程 退出 函数 


(gdb) 
Do in — libc start main () from /lib64/libc.so.6 
(gdb)} 
| single stepping until exit from function tibc start main, 
| which has no line number information. 
| Program exited normally. 
| tgqdb} [] 
图 5-24 ”在 gdb 调 斌 过程 程序 执行 结束 


输入 “q”， 结 束 调 试 ， 如 图 5-25 所 示 。 


Program exited normally. 
(gdbj q 
[sharexu@linux 0504]$ 


图 5-25 退出 gdb 调 试 状态 
上 述 一 共用 了 以 下 这 些 命令 。 
I: 列 出 函数 代码 及 其 行 数 。 
b 16: 在 代码 16 行 处 设置 断 点 。 
b func: 在 函数 func 处 设置 断 点 。 
r: 运行 程序 。 
n: 单条 执行 语句 。 
pi: 打印 变量 的 值 。 
bt: 查看 函数 的 堆栈 。 
finish: 退出 函数 。 


q: 结束 调试 。 











2. 用 gdb 分 析 coredump 文 件 


























gdb 还 可 以 用 于 分 析 coredump 文 件 。core， 又 称 之 为 coredump 文 件 ， 是 UNIX/Linux 操 作 系 统 的 一 种 机 制 ， 对 于 线 上 服务 而 言 ，core 令 人 闻 之 色 变 ， 因 为 出 core 的 过 程 意味 着 服务 暂时 不 能 正常 响 
应 ,需要 恢复 ， 并 且 随 着 Core 进 程 的 内 存 空间 越 大 ， 此 过 程 可 能 持续 很 长 一 段 时 间 (例如 ， 当 进程 占用 60GB+ 内 存 时 ， 完 整 coredump 文 件 需要 15min 左 右 才能 完全 写 到 磁盘 上 ) ， 这 期 间 产生 的 流量 损 
A, 不 可 估量 。 


























凡事 儿 有 两 面 性 ,操作 系 统 在 coredump 的 同时 ， 虽 然 会 终止 当前 进程 ， 但 是 也 会 保留 下 第 一 手 的 现场 数据 ， 操 作 系统 仿佛 是 一 架 被 按 下 快门 的 相机 ， 而 照片 就 是 产 出 的 coredump 文 件 。coredump 文 
件 含 有 当 进 程 被 终止 时 内 存 、CPU 寄 存 器 和 各 种 函数 调用 堆栈 信息 等 ， 可 以 供 后 续 开发 人 员 进 行 调 试 。 



































(1) coredump 文 件 的 存储 路 径 





有 了 时候 在 执行 程序 时 ， 会 出 现 提示 Segmentation fault， 但 在 当前 目录 下 却 没有 找到 coredump 文 件 ， 可 以 通过 下 面 的 命令 看 到 core 文 件 的 存在 位 置 : 











cat /proc/sys/kernel/core pattern 











默认 值 是 core， 也 就 是 当前 目录 ， 如 果 不 是 core， 则 是 在 指定 的 目录 下 。 


Qua 


这 里 是 指 在 进程 当前 工作 目录 的 下 创建 。 通 常 与 程序 在 相同 的 路 径 下 。 但 如 果 程 序 中 调用 了 chdir 函 数 ， 则 有 可 能 改变 了 当前 工作 目录 。 这 时 core 文 件 创建 在 chdir 指 定 的 路 径 下 。 有 好 多 程序 即使 角 溃 
了 ， 也 找 不 到 cote 文 件 放 在 什么 位 置 ， 这 和 chdir 函 数 就 有 关系 。 当 然 程 序 前 溃 了 不 一 定 都 产生 cote 文 件 。 








通过 下 面 的 命令 可 以 更 改 coredump 文 件 的 存储 位 置 ， 若 你 希望 把 core 文 件 生成 到 /data/coredump/core 目 录 下 : 





echo “/data/coredump/core” > /proc/sys/kernel/core pattern 





























注意 ， 这 里 当前 用 户 必须 具有 对 /proc/sys/kernel/core_pattern 的 写 权 限 。 




















默认 情况 下 ， 内 核 在 coredump 时 所 产生 的 core 文 件 放 在 与 该 程序 相同 的 目录 中 ， 并 且 文 件 名 固定 为 core。 很 显然 ， 如 果 有 多 个 程序 产生 core 文 件 ， 或 者 同一 个 程序 多 次 崩溃 ， 就 会 重复 覆盖 同一 个 
core 文 件 ， 因 此 有 必要 对 不 同 程序 生成 的 core 文 件 进行 分 别 命 















































通过 修改 kernel 的 参数 ， 可 以 指定 内 核 所 生成 的 coredump 文 件 的 文件 名 。 例 如 ， 使 用 下 面 的 命令 使 kernel 生 成 名 字 为 core.filename.pid 格 式 的 core dump 文 件 : 




















echo "/data/coredump/core.$e.$p" »/proc/sys/kernel/core pattern 


这 样 配 置 后 ， 产 生 的 core 文 件 中 将 带 有 半 溃 的 程序 名 、 以 及 它 的 进程 ID。 上 面 的 %e 和 %p 会 被 替换 成 程序 文件 名 以 及 进程 的 ID。 


如 果 在 上 述 文件 名 中 包含 目录 分 隔 符 “/”， 那 么 所 生成 的 core 文 件 将 会 被 放 到 指定 的 目录 中 。 需 要 说 明 的 是 ， 在 内 核 中 还 有 一 个 与 coredump 相 关 的 设置 ， 就 是 /proc/sys/kernel/core_uses_pid。 如 
果 这 个 文件 的 内 容 被 配置 成 1， 那 么 即使 core_pattern 中 没有 设置 %p， 最 后 生成 的 core dump 文 件 名 仍 会 加 上 进程 的 ID。 








(2) 产生 coredump 文 件 的 条 件 


























有 时 候 ， 程 序 coredump 了 ， 如 图 5-26 所 示 ， 却 没有 生成 coredump 文 件 (执行 程序 时 提示 Segmentation fault) ， 那 我 们 就 该 找 找 纠结 是 什么 原因 导致 没 生 成 coredump 文 件 。 











1) 产生 coredump 文 件 的 条 件 ， 首 先 需要 确认 当前 会 话 的 能 生成 的 coredump 文 件 大 小 ， 若 大 小 为 0， 则 不 会 产生 对 应 的 coredump 文 件 ， 这 样 就 需要 进行 修改 和 设置 了 。ulimit-c 命 令 可 以 查看 
coredump 文 件 大 小 的 最 大 值 。 


[sharexu@linux 0506]$ 


egmentation fault 


图 5-26 ”程序 coredump 时 的 提示 语 











45-27 ”系统 不 能 生成 coredump 文 件 时 执行 ulimit-c 命 令 的 结果 




















执行 ulimit-c unlimited 命 令 ， 可 以 设置 coredump 文 件 的 大 小 为 不 受 限制 ， 如 图 5-28 所 示 。 





KU 人 LInmUX 0505]$ ulimit 


ET 


[sharexualinux B595]$ ulim1t 
unlimited 
[sharexuglinux 





图 5-28 修改 系统 可 生成 coredumpb 文 件 大 小 限制 的 命令 


若 想 甚 至 对 应 的 字符 大 小 ， 则 可 以 指定 : 


ulimit -c [size] 





可 以 看 出 ， 这 里 的 size 的 单位 是 blocks， 一 般 1block=512Bytes 

















但 当前 设置 的 ulimit 只 对 当前 会 话 有 效 ， 若 想 系统 均 有 效 ， 则 需要 进行 如 下 设置 。 


在 /etc/profile 中 加 入 以 下 一 行 ， 这 将 允许 生成 coredump 文 件 : 


ulimit-c unlimited 



































2) 当前 用 户 ， 即 执行 对 应 程序 的 用 户 具 有 对 写 入 core 目 录 的 写 权限 以 及 有 足够 的 空间 。 























保证 以 上 两 点 后 ， 再 执行 文件 ， 就 会 发 现 coredump 时 的 提示 变 成 了 如 图 5-29 所 示 的 情况 。 


[sharexu@linux 0506]$ 











Segmentation fault 


图 5-29 有 coredump 文 件 产生 时 的 提示 语 





提示 Segmentation fault (core dumped) ， 接 着 就 只 需 去 cat/proc/sys/kernel/core_pattern 输 出 的 目录 下 找到 该 coredump 文 件 即 可 。 


(3) 产生 coredump 文 件 的 原因 








造成 程序 coredump 的 原因 有 很 多 ， 这 里 总 结 一 些 比较 常用 的 经 验 。 









































1) 内 存 访问 越界 ， 可 能 的 具体 原因 是 : @ 由 于 使 用 错误 的 下 标 ， 导 致 数组 访问 越界 ，@ 搜 索 字 符 串 时 ， 依 靠 字符 串 结束 符 来 判断 字符 串 是 否 结束 ， 但 是 字符 串 没有 正常 的 使 用 结束 符 ; OE 















































strcpy，strcat，sprintf，strcmp，strcasecmp 等 字符 串 操 作 函 数 时， 容易 出 现 将 目标 字符 串 读 / 写 越界 的 情况 。 应 该 使 用 strncpy，strlcpy，strncat，strlcat，snprintf，strncmp，strncasecmp 等 函数 防 


止 读 容易 出 现 写 越界 。 




















2) 多 线程 程序 使 用 了 线程 不 安全 的 函数 。 



































应 该 使 用 下 面 这 些 可 重 入 的 函数 ， 它 们 很 容易 被 用 错 : asctime r (3c) 、gethostbyname r (3n) 、getservbyname r (3n) 、ctermid r (3s) 、gethostent r (3n) , getservbyport r (3n) 、 
ctime r (3c) 、getlogin r (3c) 、getservent r (3n) 、 fgetgrent r (3c) , getnetbyaddr r (3n) , getspent r (3c) . fgetpwent r (3c) 、getnetbyname r (3n) , getspnam r (3c) 、 
fgetspent r (3c) ` getnetent r (3n) , gmtime r (3c) , gamma r (3m) , getnetgrent r (3n) 、 lgamma r (3m) , getauclassent r (3) , getprotobyname r (3n) . localtime r (3c) 、 
getauclassnam r (3) `, etprotobynumber r (3n) , nis sperror r (3n) , getauevent r (3) , getprotoent r (3n) , rand r (3c) , getauevnam r (3) . getpwent r (3c) 、 
readdir r (3c) . getauevnum r (3) 、 getpwnam r (3c) , strtok r (3c) . getgrent r (3c) ` getpwuid r (3c) 、 tmpnam r (3s) . getgrgid r (3c) . getrpcbyname r (3n) 、 
ttyname r (3c) , getgrnam r (3c) ` getrpcbynumber r (3n) . gethostbyaddr r (3n) 和 getrpcent r (3n) 。 


3) 多 线程 读 写 的 数据 未 加 锁 保 护 。 














对 于 会 被 多 个 线程 同时 访问 的 全 局 数据 ， 应 该 注意 加 锁 保 护 ， 否 则 很 容易 造成 coredump。 
































4) 非法 指针 ， 包 括 使 用 空 指针 或 随意 使 用 指针 转换 。 














随意 使 用 指针 转换 是 指 一 个 指向 一 段 内 存 的 指针 ， 除 非 确定 这 段 内 存 原先 就 分 配 为 某 种 结构 或 类 型 ， 或 者 这 种 结构 或 类 型 的 数组 ， 否 则 不 要 将 它 转换 为 这 种 结构 或 类 型 的 指针 ， 而 应 该 将 这 段 内 存 拷贝 
到 一 个 这 种 结构 或 类 型 中 ， 再 访问 这 个 结构 或 类 型 。 这 是 因为 如 果 这 段 内 存 的 开始 地 址 不 是 按照 这 种 结构 或 类 型 对 齐 的 ， 那 么 访问 它 时 就 很 容易 因为 bus error 出 现 core dump 错 误 。 




















5) 堆栈 溢出 。 
































不 要 使 用 大 的 局 部 变量 (因为 局 部 变量 都 分 配 在 栈 上 ) ， 这 样 容易 造成 堆栈 溢出 ， 破 坏 系统 的 栈 和 堆 结构 ， 导 致 出 现 莫名 其 妙 的 错误 。 














3.gdb 定 位 coredump 文 件 


【 例 5.6】 ”非法 访问 内 存 。 


#include <stdio.h> 


* 
return 0; 























g++-g-0 test test.cpp 编 译 该 文件 ， 得 到 test 这 个 可 执行 文件 。 执 行 ./test 命 令 后 ， 结 果 如 图 5-30 所 示 。 














[sharexu@linux 0506]$ ./test 





Segmentation fault (core dumped) 


5-30” 例 5.6 程 序 的 执行 结果 

















对 程序 进行 coredump 后 ， 把 coredump 文 件 放 到 当前 目录 下 以 备 分 析 ， 先 来 看 下 该 coredump 文 件 的 ELF 头 部 ， 如 图 5-31 所 示 。 
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图 5-31 用 readelf 命 令 查看 coredump 文 件 的 ELF 头 部 





可 以 看 到 文件 类 型 是 CORE， 表 示 这 是 core-dump 文 件 。 



































使 用 GDB， 先 从 可 执行 文件 中 读 取 符 号 表 信息 ， 然 后 读 取 core 文 件 。 如 果 不 与 可 执行 文件 一 起 操作 可 以 吗 ?” 答 案 是 不 行 的 ， 因 为 core 文 件 中 没有 符号 表 信 息 ， 无 法 进行 调试 ， 可 以 使 用 如 下 命令 来 验 























证 : 


objdump -x core.test.13093 | tail 





执行 结果 如 图 5-32 所 示 。 











[sharexuglinux 85806]& objdump -x corae.test.13003 | tail 

35 load26 geoieonc  Ogoo7fifads5400DPb  O2GOOoOO0050000000  DObOscoOO0 
CONTENTS. ALLOC. LOAD 

37 load?” 00001000  DaOO07fifa4oeaOG0D  OGO0DOOODOO0GOO0D 00052000 
CONTENTS, ALLOC, LOAD, READONM Y, CODE 

38 loadzg Beescoeo ffffffiffleosooB BOoooBOOOBOOBGOOD 685053500 
ALLDC, READONLY. CODE 





SYMBOL TABLE: 


no symbols 


[sharexuglinux 8586515 f 


用 objdump 命 令 查看 coredump 文 件 的 符号 表 


其 中 可 以 看 到 如 下 两 行 信息 : 


表明 当前 的 ELF 格 式 文件 中 没有 符号 表 信息 。 


接着 来 看 下 是 core 在 哪 了 。 执 行 gdb test core.test.13093 命 令 后 结果 如 图 5-33 所 示 。 


[sharexualinux G566]$ gdb test core, test,13093 

GNU gdb (GDB) Red Hat Enterprise Linux 

Copyright (C) 2016 Free Software Foundation, Inc. 

License GPLv34: GNU GPL version 3 or later «http://gnu.org/licenses/gpl.html2 

This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 

and "show warranty" for details 

This GDB was configured as "x85 63-redhat-linux-gnu". 

For bug reporting instructions, please see: 

«http://www .gnu.org/software/gdb/bugs/»... 

Reading symbols from /home/sharexu/charpteres/8566/test...done. 

[New Thread 136093] 

Missing separate debuginfo for 

Try: yum --disablerepo-'*' --enablerepo='*-debug*' install /usr/lib/debug/ .build-id/20/1b9698daa2cd5f7035 
adål5e9c jddO6ebdbOa2 

Reading symbols from /usr/lib54/libstdc-.s0.6...(no debugging symbols found}. ..done. 
Loaded symbols for /usr/lib§4/libstdc++.s0.6 

Reading symbols from /lib64/libm.so.6...(no debugging symbols foundi...done. 

Loaded symbols for /lib64/libm.so.6 

Reading symbols from /lib64/libgcc s.50.1...(no debugging symbols found]...done. 
Loaded symbols for /LIib54/Libgcc 5.50,1 

Reading symbols from /lib64/libc.so.6...{no debugging symbols found). ..done. 

Loaded symbols for /lib64/libc.so.6 

Reading symbols from /lib64/ld-linux-x86-64.90.2...(no debugging symbols found)...done. 
Loaded symbols for /lib64/ld-linux-x86-64.50.2 

Core was generated by `./test'. 

Program teminated with signal 11. Segmentation fault. 

#0 0x0000000606466566 in main [} at test.cpp:5 

5 *a-b; 

Missing separate debuginfos. use: debuginfo-install glibc-2.12-1.149,e16 5.5.x86 64 libgcc-4. 
6 64 libstdc---4.4.6-4,.815. xB5 64 

‘adb) E 


图 5-33 ”用 gdb 调 试 coredump 文 件 


结果 显 式 是 在 程序 第 5 行 ，*a=b 处 ， 分 别 打印 变量 a 和 变量 b 的 值 ， 如 图 5-34 所 示 。 








图 5-34 在 gdb 调 试 过 程 中 打印 变量 的 值 


发 现 a 变 量 指向 的 地 址 是 非法 区 域 ， 也 就 是 因为 3 没有 分 配 内 存 导致 。 第 5 行 应 该 改 成 : 











a-&b; 


这 样 就 把 a 指 向 b 了 。 























可 以 使 用 GDB 一 步 一 步 地 调试 程序 ， 也 可 以 用 GDB 调 试 coredump 的 程序 。 建 议 读者 把 命令 都 熟 记 ， 这 样 用 起 来 会 更 加 得 心 应 手 。 
























































top 命 令 是 Linux 下 常用 的 性 能 分 析 工 具 ， 能 够 实时 显示 系统 中 各 个 进程 的 资源 占用 状况 ， 类 似 于 Windows 的 任务 管理 器 。 下 面 详细 介绍 它 的 使 用 方法 。 






































top 命 令 的 部 分 截图 如 图 5-35 所 示 。 














top - 07:57:54 up 9 days, 9:10, 2 load average: 0.00, 0.00, 0.80 
LEELEE l running, 7 0 stopped, 0 zombie 
cpu({s): 0.3% 9.0*sy, 0.0*$ni, 99.0 0.73wa,  O.Ot*hi, 0.0%5i, 0.9%st 
Mem : t 2k total. T 398K U : 14644k free, 1328k buffers 
Swap: 44k total, 172359 e 1924776k free, 27480k cached 
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图 5-35 top 命令 结果 截图 








第 1 行 分 别 显示 : 系统 当前 时 间 、 系 统 运行 时 间 、 当 前 用 户 登 录 数 和 系统 负载 。 系 统 负载 (load average) ， 这 里 有 3 个 数值 ， 分 别 是 系统 最 近 1min、5min、15min 的 平均 负载 。 一 般 对 于 单个 处 理 器 
来 说 ,负载 在 0~1.00 是 正常 的 ， 超 过 1.00 就 要 引起 注意 了 。 在 多 核 处 理 器 中 ， 系 统 均值 不 应 该 高 于 处 理 器 核心 的 总 数 。 























第 2 行 分 别 显 示 : total (进程 总 数 ) 、running (正在 运行 的 进程 数 ) 、sleeping (睡眠 的 进程 数 ) 、stopped (停止 的 进程 数 ) 和 zombie (僵尸 进程 数 ) 。 
































第 3 行 分 别 显 示 : %us (用 户 空间 占用 CPU 百分比 ) 、%sy (内 核 空间 占用 CPU 百 分 比 ) 、%ni (用 户 进程 空间 内 改变 过 优先 级 的 进程 占用 CPU 百 分 比 ) 、%id (空闲 CPU 百分比 ) 、%wa (等 待 输 入 输 


















































出 (VO) 的 


态 ) 、%CPU (CPU 占 


CPU 时 间 百 分 比 ) 、%hi (cpu 处 理 硬件 中 断 的 时 间 ) 、%si (cpu 处 理 软 中 断 的 时 间 ) . 96st ( 





























第 4 行 则 显示 内 存 MEM 的 数据 : total (物理 内 存 总 量 ) 、used (使 用 的 物理 内 存 总 量 ) . free (空闲 内 存 总 量 ) 、buffers (用 作 内 核 缓存 的 内 存量 ) 





























第 5 行 则 显示 交换 器 SWAP 的 数据 : total (交换 区 总 量 ) 、used (使 用 的 交换 区 总 量 ) 、free (空闲 交换 区 总 量 ) 、cached (缓冲 的 交换 区 总 量 ) 。 











于 有 虚拟 cpu 的 情况 ) 。 通 常 id9% 值 可 以 反映 一 个 系统 cpu 的 闲 忙 程度 。 


buffers 和 cached 的 区 别 需要 说 明 一 下 ，buffers 指 的 是 块 设备 的 读 写 缓冲 区 ，cached 指 的 是 文件 系统 本 身 的 页 面 缓存 。 它 们 都 是 Linux 操 作 系统 底层 的 机 制 ， 目 的 就 是 为 了 加 速 对 磁盘 的 访问 。 












































第 6 行 则 显示 PID (进程 号 ) USER (运行 用 户 ) 、PR (优先 级 ) 、NI (任务 nice 值 ) 、VIRT (虚拟 内 存 用 量 ) VIRT=SWAP+RES、RES (物理 内 存 用 量 ) 、SHR (共享 内 存 用 量 ) 、S (进程 状 




















top 命 令 显示 系统 当前 的 进程 和 其 他 状况 ，top 是 一 个 动态 显示 过 程 ， 即 可 以 通过 
说 ，top 命 令 提供 了 实时 
式 命 令 或 者 在 个 人 定制 文件 中 进行 设 定 。 





输入 “q”， 则 退出 top 命 令 。 


54 ps 




















比 ) 、%MEM (物理 内 存 占 用 比 ) 、TIME+ (累计 CPU 占用 时 间 ) 、COMMAND 命 令 名 /命令 行 。 















































户 按 键 来 不 断 刷新 当前 状态 。 如 果 在 前 台 执行 该 命令 ， 它 将 独占 前 台 ， 直 到 用 户 终止 该 程序 为 止 。 比 较 准 确 地 





























也 对 系统 处 理 器 的 状态 监视 。 它 将 显示 系统 中 CPU 最 “敏感 ”的 任务 列表 。 该 命令 可 以 按 CPU 使 用 、 内 存 使 用 和 执行 时 间 对 任务 进行 排序 ;而 且 该 命令 的 很 多 特性 都 可 以 通过 交互 








Linux 中 的 ps (process status) 命令 列 出 的 是 当前 在 运行 的 进程 的 快照 ， 就 是 执行 ps 命令 的 那个 时 刻 的 那些 进程 ， 如 果 想 要 动态 地 显示 进程 信息 ， 就 可 以 使 用 top 命 令 。 


























要 对 进程 进行 监测 和 控制 ， 首 先 必须 要 了 解 当前 进程 的 情况 ， 也 就 是 需要 查看 当前 进程 ， 而 ps 命令 就 是 最 基本 同时 也 是 非常 强大 的 进程 查看 命令 。 使 











该 命令 可 以 确定 有 哪些 进程 正在 运行 及 其 运行 的 























状态 、 进 程 是 否 结束 、 进 程 有 没有 僵 死 、 哪 些 进程 占用 了 过 多 的 资源 等 。 总 之 大 部 分 信息 都 是 可 以 通过 执行 该 命令 得 到 的 。 


























ps 命令 提供 进程 的 一 次 性 的 查看 ， 它 所 提供 的 查看 结果 并 不 动态 连续 的 ; 如 果 想 对 进程 时 间 监 控 ， 应 该 用 top 命 令 。 


kill 命 令 用 于 杀 死 进程 。 


(1) Linux 上 进程 有 5 种 状态 ， 如 下 所 述 。 





1) 运行 (正在 运行 或 在 运行 队列 中 等 


待 ) 。 


2) 中 断 (休眠 中 ， 受 阻 ， 在 等 待 某 个 条 件 的 形成 或 接受 到 信号 ) 。 


3) 不 可 中 断 〈 收 到 信号 不 唤醒 和 不 可 运行 ， 进 程 必须 等 待 直到 有 中 断 发 生 ) 。 


4) 僵 死 (进程 已 终止 ， 但 进程 描述 符 























f 存 在 ， 直 到 父 进 程 调 用 wait4 () 系统 调用 后 释放 ) 。 




















5) 停止 (进程 收 到 SIGSTOP，SIGSTP，SIGTIN，SIGTOU 信 和 号 后 停止 运行 运行 。 

















(2) ps 工具 标识 进程 的 5 种 状态 码 ， 如 下 所 述 。 








1) D 不 可 中 断 : uninterruptible sleep (usually IO) 。 


2) R 运 行 : runnable (on run queue) 。 


3) S 中 断 : sleeping. 


4) T 停 止 : traced or stopped。 


5) Z 僵 死 : a defunct ("zombie") process, 





命令 格式 是 : ps[ 参 数 ]。 命 令 功能 是 


1.ps 命 令 常用 参数 











表 5-1 描 述 了 ps 命令 的 常用 参数 。 


























来 显示 当前 进程 的 状态 。 


表 5-1 Ps 命令 常用 参数 


--help 


数 I 能 


显示 也 有 进程 

显示 同一 终端 下 的 所 有 程序 
显示 所 有 进程 

显示 进程 的 真实 名 称 

-e SOT U-AC 

显示 环境 变量 

显示 程序 间 的 关系 

显示 树 状 结构 

显示 当前 终 问 的 进程 
显示 当前 终端 的 所 有 程序 
指定 用 户 的 所 有 进程 
TIRRENI 

显示 所 有 包 舍 其 他 使 用 者 的 行程 
列 出 指定 命令 的 状况 

显示 帮助 信息 


--version 显示 版 本 


2.ps 命 令 使 用 实例 





【 例 5.7】 ”ps 命令 学 习 实 例 。 


这 里 ,我 们 先 写 一 个 程序 ， 使 其 能 运行 一 段 时 间 ， 方 便 我 们 更 好 地 了 解 ps 命令 。 





#include<iostream> 


} 
} 
return 0; 


程序 的 执行 结果 如 图 5-36 所 示 。 

例 5.7 中 ， 是 利用 for 循 环 打印 一 个 数字 ， 每 打 一 次 就 休眠 5s， 一 共 打印 100 次 。 
(1) 显示 指定 用 户 信息 。 

命令 : ps-u sharexu 


输出 : 如 图 5-37 所 示 。 
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的 执行 结果 (省 





[sharexu@linux 
PID TTY 
13580 





其 中 的 test 进 程 ， 正 是 刚刚 手动 运行 的 那个 。 





(2) 显示 所 有 进程 信息 ， 连 同 命令 行 。 


命令 : ps-ef 





输出 : 如 图 5-38 所 示 。 























(3) ps 与 grep 常 用 组 合用 法 ， 查 找 特定 进程 。 




















命令 : ps-eflgrep test 





输出 : 如 图 5-39 所 示 。 











[sharexuglinux -]£& ps 
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(4) 将 目前 登入 的 PID 与 相关 信息 列 示 出 来 。 


命令 : ps-| 





输出 : 如 图 5-40 所 示 。 
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图 5-37 用 ps 命令 显 式 指定 用 户 的 信息 


ef 
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5-39 ”结合 ps 命令 和 grep 命 令 查找 特定 进程 
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图 5-40 ”用 ps 命令 显 式 与 这 次 登入 的 PID 的 相关 信息 


各 相关 信息 的 意义 如 下 所 述 。 








1) F 代 表 这 个 程序 的 旗 标 (flag) ，4 代 表 使 用 者 为 super user, 











2) S 代 表 这 个 程序 的 状态 (STAT) ,关于 各 STAT 的 意义 将 在 下 文中 介绍 。 





3) UID 程 序 被 该 UID 所 拥有 。 


4) PID 就 是 这 个 程序 的 进程 id。 











5) PPID 则 是 其 父 进程 的 进程 id。 




















6) 《是 使 用 的 CPU 资源 百分比 。 























7) PRI 是 Priority (优先 执行 序 ) 的 缩写 。 


8) NI 是 Nice 值 。 


9) ADDR 是 kernel function， 指 出 该 程序 在 内 存 的 那个 部 分 。 如 果 是 个 running 的 程序 ， 一 般 就 是 。 


10) SZ 使 用 掉 的 内 存 大 小 。 





11) WCHAN 目 前 这 个 程序 是 否 正在 运作 当中 ， 若 为 -表示 正在 运作 。 





12) TTY 登 入 者 的 终端 机 位 置 。 








13) TIME 使 用 掉 的 CPU 时 间 。 











14) CMD 所 下 达 的 指令 内 容 。 





在 预 设 的 情况 下 ，ps 仅 会 列 出 与 目前 所 在 的 bash shell 有 关 的 PID 而 已 ， 所 以 ， 


(5) 列 出 目前 所 有 的 正在 内 存 当中 的 程序 。 


命令 : ps aux 





输出 : 如 图 5-41 所 示 。 
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1) USER: 该 进程 属于 那个 使 用 者 账号 的 。 














2) PID: 该 进程 的 号 码 。 











3) 96CPU: 该 进程 使 用 掉 的 CPU 资源 百分比 。 




















4) %MEM : 该 进程 所 占用 的 物理 内 存 百 分 比 。 














5) VSZ: 该 进程 使 用 掉 的 虚拟 内 存量 (KBytes) 。 

















6) RSS: 该 进程 占用 的 固定 的 内 存量 (KBytes) 。 





当 使 用 ps-| 的 时 候 ， 只 有 2 个 PID。 





TIME COMMAND 
FERITATE 
[kth readd] 
[| 


Dr 


Ln un cnm Ln 


[migration 
[watchdog 
[events/ 
[cqroup] 
[khelper] 


5-41 用 ps 命令 列 出 目前 所 有 的 正在 内 存 当中 的 程序 (省 略 部 分 结果 ) 














7) TIY: 该 进程 是 在 那个 终端 机 上 面 运作 ， 若 与 终端 机 无 关 ， 则 显示 “? ”， 











8) STAT: 该 程序 目前 的 状态 ， 主 要 的 状态 有 以 下 几 种 。 














另外 ，tty1-tty6 是 本 机 上 押 








的 登入 者 程序 ， 若 为 pts/0 等 ， 则 表示 为 由 网 络 连 接 进 主机 的 程序 。 





a.R: 该 程序 目前 正在 运作 ， 或 者 是 可 被 运作 。 


b.S: 该 程序 目前 正在 睡眠 当中 (可 说 是 idle 状 态 ) , 


cT: 该 程序 目前 正在 侦 测 或 者 是 停止 了 。 


dz: 该 程序 应 该 已 经 终止 


但 可 被 某 些 信号 (signal) 唤醒 。 


， 但 是 其 父 程序 却 无 法 正常 地 终止 它 ， 造 成 zombie (E7) 程序 的 状态 。 


e.START: 该 process 被 触发 启动 的 时 间 。 


fTIME: 该 process 实 际 使 


g.COMMAND: 该 程序 的 


关于 进程 和 进程 的 状态 ， 后 


5.5 Valgrind 


5.5.1 ”Valgrind 概 述 


etn Valgrind 是 一 套 Linux 下 的 开放 源 代码 的 仿真 调试 工具 的 集合 。Valgrind 由 内 核 以 及 基于 内 核 的 其 他 调试 工 




















实际 指令 。 





用 CPU 运作 的 时 间 。 














环境 ， 并 提供 服务 给 其 他 工具 ; 





Valgrind 包 括 如 下 一 些 工具 。 





其 他 工具 则 类 似 于 插件 ， 





面 会 有 详细 的 章节 专门 来 讲 ， 这 里 就 先 不 展开 了 。 











利用 内 核 提供 的 服务 完成 各 种 特定 的 内 存 调试 任务 。Valgrind 的 体系 结构 如 图 
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图 5-42 Valgrind 体 系 结构 图 


























(1) Memcheck: 这 是 Valgrind 应 
等 。 这 些 问题 往往 是 C/C+ + 程序 员 最 头疼 


(2) Callgrind: 和 gprof 类 似 的 分 析 工 








最 广泛 的 工 
































行 时 的 一 些 数据 ， 建 立 函数 调 




















(3) Cachegrind: 它 主要 


户 提供 Cache 丢 失 次 数 、 内 存 引 








(4) Helgrind: CEF} 
































来 检查 多 线程 程序 中 出 现 的 竞争 问题 


关系 图 ， 还 可 以 有 选择 


来 检查 程序 中 缓存 使 
次 数 以 及 每 行 代码 、 每 个 函 














地 进行 Cache 模 拟 。 在 运行 结束 时 ， 

















一 个 重量 级 的 内 存 检查 器 ， 能 够 发 现 开 发 中 绝 大 多 数 内 存 错误 使 用 情况 ， 比 如 : 使 
的 问题 ，Memcheck 在 这 里 帮 上 了 大 忙 。 











出 现 的 问题 。Cache 分 析 器 ， 它 模拟 CPU 中 的 一 级 缓存 11、DI 和 二 级 缓存 ， 能 够 精确 
数 、 每 个 模块 及 整个 程序 产生 的 指令 数 ， 这 对 优化 程序 有 很 大 的 帮助 。 





5-42 所 示 。 


组 成 。 内 核 类 似 于 一 个 框架 ， 它 模拟 了 一 个 CPU 





Callgrind |Cachegrind| Helgrind Extension 


unter test 




















未 初始 化 的 内 存 ， 使 





地 指出 程序 中 Cache 的 丢失 和 命中 。 如 果 需 要 ， 它 还 能 够 为 








错误 。Helgrind 实 现 了 名 为 Eraser 的 竞争 检测 算法 ， 并 做 了 进一步 改进 ,减少 了 报告 错误 的 次 数 。 


(5) Massif: 堆栈 分 析 器 ， 








它 能 测量 程序 在 堆栈 中 使 


运行 ， 减 少 程序 停留 在 交换 区 中 的 几率 。 





















































(6) Extension: 可 以 利 


5.6 本章 小 结 








Core 提 供 的 功 全 











&， 自 己 编写 特定 的 内 存 调 试 工具 。 





。 Helgrind 寻 找 内 存 中 被 多 个 线程 访问 ， 而 又 没有 一 贯 加 锁 的 区 域 ， 这 些 


了 多 少 内 存 ， 告 诉 我 们 堆 块 、 堆 管理 块 和 栈 的 大 小 。 








Massif 能 帮助 我 们 减少 内 存 的 使 
































区 域 往往 是 线程 之 间 失 去 同步 的 地 方 ， 而 且 会 导致 难以 发 掘 的 


， 在 带 有 虚拟 内 存 的 现代 系统 中 ， 它 还 能 够 加 速 程序 的 


已 经 释放 了 的 内 存 ， 内 存 访问 越界 


电 ， 但 它 对 程序 的 运行 观察 更 是 入 微 ， pL 。 和 gprof 不 同 ， 它 不 需要 在 编译 源 代码 时 附加 特殊 选项 ， 但 推荐 加 上 调试 选项 。Callgrind 收 集 程序 运 
会 把 分 析 数 据 写 入 一 个 文件 。callgrind_annotate 可 以 把 这 个 文件 的 内 容 转化 成 可 读 的 形式 。 























本 章 讲述 了 各 种 调试 程序 的 工具 ， 项 望 在 读者 实际 编码 过 程 中 ， 可 助 读者 一 臂 之 力 。 


前 面 都 是 讲 一 个 程序 里 的 各 部 分 关系 ， 接 下 来 要 将 的 是 两 台 机 器 的 程序 间 的 关系 。 两 台 计 算 机 之 间 ， 需 要 通过 网 络 协议 才能 进行 通信 。 那 么 网 络 协议 又 是 怎么 样 的 呢 ? 这 部 分 将 在 第 6 章 为 读者 进行 解 


P 


第 6 章 TCP 协 议 


信息 交流 的 价值 越 来 越 凸 显 ， 那 网 络 中 程序 之 间 如 何 通信 ， 如 每 天 打开 浏览 器 浏览 网 页 时 ， 浏 览 器 的 程序 怎么 与 Web 服 务 器 进行 通信 的 ? 当 使 用 QQ 聊天 时 ，QQ 怎 么 与 服务 器 或 你 好 友 所 在 的 QQ 进行 通 
信 呢 ? 这 些 都 得 靠 网 络 通信 ， 网 络 通信 是 通过 网 络 将 各 个 孤立 的 设备 进行 连接 ， 通 过 信息 交换 实现 人 与 人 、 人 与 计算 机 、 计 算 机 与 计算 机 之 间 的 通信 。 网 络 通信 中 最 重要 的 就 是 网 络 通信 协议 ， 而 网 络 通信 
协议 中 最 重要 的 就 是 TCP/IP 协 议 ， 本 章 将 探索 TCP/IP 协 议 。 


6.1 TCP 协 议 


6.1.1. ”网络 模型 


1. 七 层 网 络 模型 

















20 世 纪 70 年 代 以 来 ， 国 外 一 些 主要 计算 机 生产 三 家 先后 推出 了 各 自 的 网 络 体系 结构 ， 但 它们 都 属于 专用 的 。 为 使 不 同 计算 机 厂家 的 计算 机 能 够 互相 通信 ， 以 便 在 更 大 的 范围 内 建立 计算 机 网 络 ， 有 必要 
建立 一 个 国际 范围 的 网 络 体系 结构 标准 。 为 此 ， 国 际 标准 化 组 织 ISO 于 1981 年 正式 推荐 了 一 个 网 络 系统 结构 一 一 七 层 参 考 模型 ， 也 叫 作 开放 系统 互 连 模型 。 由 于 这 个 标准 模型 的 建立 ， 使 得 各 种 计算 机 网 络 
均 向 它 靠拢 ， 大 大 推动 了 网 络 通 信 的 发 展 。 这 个 1SO 七 层 网 络 模型 各 层 的 名 字 、 主 要 功能 、 对 应 的 典型 设备 和 传输 单位 如 表 6-1 所 示 。 



























































表 6-1 ISO 七 层 网 络 模型 及 其 功能 展示 




















主要 功能 对 应 的 典型 设备 | 传输 单位 
计算 机 : MHJ., W FTP, SMTP, 
E H3 y LE [833 H S 级 数据 
提供 应 用 程序 间 通 f HTTP 4 程序 级 数据 
.| 计算 机 : 编码 方式 ， 如 图 像 编 解码 、 
处 理 数 据 格 式 、 数 据 加 密 等 URL 字段 传输 编码 等 程序 级 数据 
- — ] 计算 机 : 建立 会 话 ， 如 session 认证 、 
建立 、 维 护 和 管理 会 话 断 点 续 伟 程序 级 数据 
4 建立 主机 端 到 端 连 接 计算 机 : 进程 和 端口 数据 段 (segment) 
3 网 络 层 寻 址 和 路 由 选择 网 络 : 路 由 器 、 防 火 墙 、 多 层 交 换 机 | 数据 包 (packet) 
2 数据 链 路 层 提供 介质 访问 、 链 路 管理 等 | 网 络 : 网卡、 网 桥 、 交 换 机 wi (frame) 
1 物理 层 比特 流传 输 网 络 : 中 继 器 、 集 线 器 、 网 线 和 HUB | 比特 (bit) 














这 个 七 层 网 络 模型 在 数据 的 传输 过 程 中 还 会 对 数据 进行 封装 ， 封 装 过 程 如 图 6-1 所 示 。 
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物理 层 


图 6-1 ISO 七 层 网 络 模型 的 数据 封装 与 解 封装 





















































在 ISO 七 层 网 络 模型 中 ， 当 一 台 主 机 需要 传送 用 户 的 数据 (data) 时 ， 数 据 首 先 通过 应 用 层 的 接口 进入 应 用 层 。 在 应 用 层 ， 用 户 的 数据 被 加 上 应 用 层 的 报头 (Ppplication Header, AH) ， 形 成 应 用 层 
协议 数据 单元 (Protocol Data Unit, PDU) ， 然 后 被 递交 到 下 层 表示 层 。 表 示 层 并 不 “关心 ”上 层 应 用 层 的 数据 格式 而 是 把 整个 应 用 层 递交 的 数据 包 看 成 是 一 个 整体 (应 用 层 数据 ) 进行 封装 ， 即 加 上 表 
示 层 的 报头 (Presentation Header, PH) 。 然 后 ， 递 交 到 下 层 会 话 层 。 同样 ， 会 话 层 、 传 输 层 、 网 络 层 (假设 用 TCP 传 输 ， 则 是 TCP 数 据 + IP 包 头 ) 、 数 据 链 路 层 (把 上 层 的 TCP 数 据 +1P 包 头 统一 称 为 帧 
数据 ， 即 帧 头 + 帧 数据 + 帧 尾 (CRC) ) 也 都 要 分 别 给 上 层 递交 下 来 的 数据 加 上 自己 的 报头 。 它 们 是 : 会 话 层 报头 (Session Header, SH) 、 传 输 层 报头 (Transport Header, TH) 、 网 络 层 报头 
(Network Header, NH) 和 数据 链 路 层 报头 (Data link Header, DH) 。 其 中 ， 数 据 链 路 层 还 要 给 网 络 层 递 交 的 数据 加 上 数据 链 路 层 报 尾 (Data link Termination, DT) 形成 最 终 的 一 帧 数据 。 









































































































































































































































当 一 帧 数据 通过 物理 层 传送 到 目标 主机 的 物理 层 时 ， 该 主机 的 物理 层 把 它 递交 到 上 层 一 一 数据 链 路 层 。 数 据 链 路 层 负责 去 掉 数 据 帧 的 帧 头 部 DH 和 尾部 DT (同时 还 进行 数据 校 验 ) 。 如 果 数 据 没有 出 
错 ， 则 递交 到 上 层 网 络 层 。 同 样 ， 网 络 层 、 传 输 层 、 会 话 层 、 表 示 层 、 应 用 层 也 要 做 类 似 的 工作 。 最 终 ， 原 始 数据 被 递交 到 目标 主机 的 具体 应 用 程序 中 。 
















































































2. 五 层 网 络 模型 























大 学 教科 书 中 一 般 用 了 一 个 五 层 模型 的 网 络 体系 ， 这 五 层 的 名 字 与 功能 分 别 如 下 所 述 。 












































(1) 应 用 层 : 确定 进程 之 间 通 信 的 性 质 以 满足 用 户 需求 。 应 用 层 协议 有 很 多 ， 如 支持 万 维 网 应 用 的 http 协 议 、 支 持 电子 邮件 的 SMTP 协 议 、 支 持 文件 传送 的 ftp 协 议 ， 等 等 。 


















































(2) 运输 层 : 负责 主机 间 不 同 进程 的 通信 。 这 一 层 中 的 协议 有 面向 连接 的 TCP (传输 控制 协议 ) 、 无 连接 的 UDP (用 户 数 据 报 协议 ) ; 数据 传输 的 单位 称 为 报 文 段 或 用 户 数据 报 。 












































(3) 网 络 层 : 负责 分 组 交换 网 中 不 同 主机 间 的 通信 。 作 用 为 : 发 送 数据 时 ， 将 运输 层 中 的 报 文 段 或 用 户 数据 报 封装 成 |P 数 据 报 ， 并 选择 合适 路 由 。 





























(4) 数据 链 路 层 : 负责 将 网 络 层 的 IP 数 据 报 组 装 成 帧 。 


(5) 物理 层 : 透明 地 传输 比特 流 。 





3. 四 层 网 络 模型 



































前 面 的 两 种 模型 都 是 学 术 上 的 概念 ， 使 用 并 不 广泛 。 还 有 一 个 四 层 模型 ， 使 用 最 为 广泛 一 一 TCP/IP 分 层 模型 (TCP/IP Layering Model) 。 它 有 因特网 分 层 模 型 (Internet Layering Model) 和 因 特 
网 参考 模型 (Internet Reference Model) 之 称 。 表 6-2 展 示 了 这 四 层 的 名 字 和 所 应 用 到 的 协议 。 
























































表 6-2 ”四 层 网 络 模型 


层 数 应 用 到 的 协议 


4 [ mun x 
E 
1 其 他 





TCPV/IP 协 议 被 组 织 成 4 个 概念 层 ， 其 中 有 3 层 对 应 于 1SO 参 考 模型 中 的 相应 层 。ICP/IP 协 议 族 并 不 包含 物理 层 和 数据 链 路 层 ， 因 此 它 不 能 独立 完成 整个 计算 机 网 络 系统 的 功能 ， 必 须 与 许多 其 他 的 协议 协 
同 工 作 。 











TCP/IP 分 层 模型 的 4 个 协议 层 分 别 完成 以 下 的 功能 。 





(1) 网 络 接口 


ND 





























网 络 接口 层 包 括 用 于 协作 IP 数 据 在 已 有 网 络 介质 上 传输 的 协议 。 实 际 上 TCPV/IP 标 准 并 不 定义 与 1SO 数 据 链 路 层 和 物理 层 相 对 应 的 功能 。 相 反 ， 它 定义 了 像 APP (Address Resolution Protocol, tf 
析 协 议 ) 这 样 的 协议 ， 提 供 TCP/IP 协 议 的 数据 结构 和 实际 物理 硬件 之 间 的 接口 。 























(2) 网 间 层 。 








网 间 层 对 应 于 OSI 七 层 参考 模型 的 网 络 层 。 本 层 包含 IP 协 议 、RIP 协 议 (Routing Information Protocol， 路 由 信息 协议 ) ， 负 责 数 据 的 包装 、 寻 址 和 路 由 。 同 时 还 包含 ICMP (Internet Control 
Message Protocol， 网 间 控 制 报 文 协议 ) 用 来 提供 网 络 诊断 信息 。 



































(3) 传输 层 。 





传输 层 对 应 于 OSI 七 层 参考 模型 的 传输 层 ， 它 提供 两 种 端 到 端的 通信 服务 。 其 中 TCP 协 议 (Transmission Control Protocol) 提供 可 靠 的 数据 流 运输 服务 ，UDP 协 议 (Use Datagram Protocol) 提供 
不 可 靠 的 用 户 数据 报 服务 。 这 其 中 的 TCP 协 议 是 本 章 将 要 讨论 的 重点 。 












































(4) 应 用 层 。 





























应 用 层 对 应 于 OSI 七 层 参考 模型 的 应 用 层 和 表示 层 。 因 特 网 的 应 用 层 协议 包括 Finger、Whois、FTP (文件 传输 协议 ) 、Gopher、HTTP ( 超 文 本 传输 协议 ) 、Telent (远程 终端 协议 ) 、SMTP (简单 
邮件 传送 协议 ) . IRC (因特网 中 继 会 话 ) 、NNTP (网 络 新 闻 传 输 协 议 ) 等 。 





































































































综 上 所 述 ， 我 们 需要 知道 TCP 协 议 在 网 络 OSI 的 七 层 模型 中 的 第 四 层 传输 层 ，IP 协 议 在 第 三 层 网 络 层 ，ARP 协 议 在 第 二 层 数 据 链 路 层 ; 在 第 二 层 上 的 数据 叫 Frame， 在 第 三 层 上 的 数据 叫 Packet， 第 四 层 
的 数据 叫 Segment。 所 有 程序 的 数据 首先 会 打包 到 TCP 的 Segment 中 ， 然 后 TCP 的 Segment 会 打包 到 IP 的 Packet 中 ， 然 后 再 打包 到 以 太 网 Ethernet 的 Frame 中 ， 传 到 对 端 后 ， 各 个 层 解析 自己 的 协议 ， 然 
后 把 数据 交 给 更 高 层 的 协议 处 理 。 




















6.2 TCP 网 络 编程 API 





网 络 中 进程 之 间 如 何 通信 ? 首要 解决 的 问题 是 如 何 唯一 标识 一 个 进程 ， 否 则 通信 无 从 谈 起 。 在 本 地 可 以 通过 进程 PID 来 唯一 标识 一 个 进程 ， 但 是 在 网 络 中 这 是 行 不 通 的 。 其 实 TCP/IP 协 议 族 已 经 帮 我 们 
解决 了 这 个 问题 ， 网 络 层 的 IP 地 址 可 以 唯一 标识 网 络 中 的 主机 ， 而 传输 层 的 “协议 + 端口 ”可 以 唯一 标识 主机 中 的 应 用 程序 (进程) 。 这 样 利用 三 元 组 〈IP 地 址 ， 协 议 ， 端 口 ) 就 可 以 标识 网 络 的 进程 了 ， 网 
络 中 的 进程 通信 就 可 以 利用 这 个 标志 与 其 他 进程 进行 交互 。 










































































上 面 我 们 已 经 知道 网 络 中 的 进程 是 通过 socket 来 通信 的 ， 那 什么 是 socket 呢 ?socket 起源 于 UNIX， 而 UNIX/Linux 基 本 哲学 之 一 就 是 “一 切 皆 文件 ”， 都 可 以 用 “打开 (open) 一 > 读 写 
(write/read) 一 > 关闭 (close) ”模式 来 操作 。socket 其 实 就 是 该 模式 的 一 个 实现 ，socket 即 是 一 种 特殊 的 文件 ， 一 些 socket 函 数 就 是 对 其 进行 的 操作 ( 读 / 写 、 打 开 、 关 闭 ) ， 这 些 函 数 将 在 后 面 进行 


介绍 。 




































































使 用 TCP/IP 协 议 的 应 用 程序 通常 采用 应 用 编程 接口 : UNIX BSD 的 套 接 字 (socket) 和 UNIX System V 的 TLI (已 经 被 淘汰 ) ， 来 实现 网 络 进程 之 间 的 通信 。 就 目前 而 言 ， 几 乎 所 有 的 应 用 程序 都 是 采 上 
socket， 而 现在 又 是 网 络 时 代 ， 网 络 中 进程 通信 是 无 处 不 在 ， 这 就 是 “一 切 久 socket”。 







































































既然 socket 是 “open 一 write/read 一 close” 模 式 的 一 种 实现 ， 那 么 socket 就 提供 了 这 些 操作 对 应 的 函数 接口 。 以 TCP 协 议 通 信 的 socket 为 例 ， 其 交互 流程 大 概 如 图 6-19 所 示 。 


DET 


绑 定 socket 和 端口 号 bind() 


监听 端口 号 | listen() 


接收 来 目 客户 端的 连接 请 求 














创建 socket 


connect( Sie 
连接 指定 计算 机 的 端口 


回 Ssocket 中 写 入 信息 





从 socket 中 读 取 字符 close( ) 关闭 socket 


图 6-19 TCP 交 互 流程 




















图 6-19 中 展示 的 交互 流程 ， 具 体 如 下 所 述 。 








(1) 服务 器 根据 地 址 类 型 (ipv4，ipv6) 、socket 类 型 、 协 议 创 建 socket。 





(2) 服务 器 为 socket 绑 定 I|P 地 址 和 端口 号 。 








(3) 服务 器 socket 监 听 端 口号 请 求 ， 随 时 准备 接收 客户 端 发 来 的 连接 ， 这 时 候 服务 器 的 socket 并 没有 被 打开 。 








(4) 客户 端 创建 socket。 





(5) 客户 端 打开 socket， 根 据 服 务 器 IP 地 址 和 端口 号 试图 连接 服务 器 socket。 























(6) 服务 器 socket 接 收 到 客户 端 socket 请 求 ， 被 动 打开 ， 开 始 接收 客户 端 请 求 ， 直 到 客户 端 返 回 连接 信息 。 这 时 候 socket 进 入 阻塞 状态 ， 所 谓 阻 塞 即 accept () 方法 一 直到 客户 端 返回 连接 信息 后 才 


返回 ， 开 始 接收 下 一 个 客户 端 谅解 请 求 。 
(7) 客户 端 连接 成 功 ， 向 服务 器 发 送 连接 状态 信息 。 


(8) 服务 器 accept 方 法 返回 ， 连 接 成 功 。 





(9) 客户 端 向 socket 写 入 信息 。 
(10) 服务 器 读 取 信息 。 


(11) 客户 端 关 闭 。 





(12) 服务 器 端 关闭 。 








仔细 一 看 ， 服 务 器 socket 和 客户 端 socket 建 立 连接 的 部 分 其 实 就 是 大 名 易 易 的 3 次 握手 ， 如 图 6-20 所 示 ， 详 细 分 析 可 参考 6.1.3 节 内 容 。 














下 面 介绍 几 个 基本 的 socket 接 口 函 数 。 











1.socket 函 数 





socket 的 函数 原型 如 下 所 示 : 





int socket (int domain, int type, int protocol); 


CLOSED 
socket 


SYN SENT Connect ( PHZ ) 
( 主动 打开 ) 
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Socket, bind, listen 
( 被 动 打 开 ) 
Accept ( 阻塞 ) 






Accept ( 返回 ) 





ESTABLISHED 





图 6-20 ”TCP 三 次 握手 























socket 函 数 对 应 于 普通 文件 的 打开 操作 。 普 通 文件 的 打开 操作 返回 一 个 文件 描述 字 ， 而 socket () 用 于 创建 一 个 socket 描 述 符 (socket descriptor) ， 它 唯一 标识 一 个 socket。 这 个 socket 描 述 字 跟 文 
件 描述 字 一 样 ， 后 续 的 操作 都 有 用 到 它 ， 把 它 作为 参数 ， 通 过 它 来 进行 一 些 读 写 操作 。 























正如 可 以 给 fopen 的 传 入 不 同 参 数值 ， 以 打开 不 同 的 文件 一 样 ， 创 建 socket 时 ， 也 可 以 指定 不 同 的 参数 创建 不 同 的 Socket 描 述 符 ，socket 函 数 的 3 个 参数 分 别 如 下 所 述 。 








(1) domain: 即 协议 域 ， 又 称 为 协议 族 (family) 。 常 用 的 协议 族 有 : AF_INET、AF_INET6、AF_LOCAL (或 称 AF_UNIX，Unix 域 socket) 、AF_ROUTE 等 。 协 议 族 决定 了 socket 的 地 址 类 型 ,在 
通信 中 必须 采用 对 应 的 地 址 ， 如 AF_INET 决 定 了 要 用 ipv4 地 址 (32 位 ) 与 端口 号 (16 位 ) 的 组 合 、AF_UNIX 决 定 了 要 用 一 个 绝对 路 径 名 作为 地 址 。 





















































(2) type: 指定 socket 类 型 。 常 用 的 socket 类 型 有 : SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET 等 。 其 中 ，SOCK_STREAM 表 示 提 供 面向 连接 的 稳定 数 
据 传输 ， 即 TCP 协 议 。SOCK_DGRAM 表 示 使 用 不 连续 、 不 可 靠 的 数据 包 连 接 。 









































(3) protocol: 指定 协议 。 常 用 的 协议 有 ，IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC 等 ， 它 们 分 别 对 应 TCP 传 输 协议 、UDP 传 输 协议 、STCP 传 输 协 议 、TIPC 传 输 协 议 。 


Qus 











并 不 是 说 上 面 的 type 和 protocol 是 可 以 随意 组 合 的 ， 如 SOCK_STREAM 就 不 可 以 跟 IPPROTO_UDP 组 合 。 当 protocol 为 0 时 ， 会 自动 选择 type 类 型 对 应 的 默认 协议 。 



































当 调用 socket 创 建 一 个 socket 时 ， 返 回 的 socket 描 述 字 它 存在 于 协议 族 (address family, AF XXX) 空间 中 ， 但 没有 一 个 具体 的 地 址 。 如 果 想 要 给 它 赋予 一 个 地 址 ， 就 必须 调用 bind () 函数 ， 否 则 
系统 就 在 调用 connect () 、listen () 时 自动 随机 分 配 一 个 端口 。 
































如 果 调 用 成 功 就 返回 新 创建 的 套 接 字 的 描述 符 ， 如 果 失 败 就 返回 INVALID_SOCKET (Linux 下 失败 返回 -1) 。 套 接 字 描述 符 是 一 个 整数 类 型 的 值 。 每 个 进程 的 进程 空间 里 都 有 一 个 套 接 字 描 述 符 表 ， 该 
表 中 存放 着 套 接 字 描述 符 和 套 接 字数 据 结构 的 对 应 关系 。 该 表 中 有 一 个 字段 存放 新 创建 的 套 接 字 的 描述 符 ， 另 一 个 字段 存放 套 接 字数 据 结构 的 地 址 ， 因 此 根据 套 接 字 描 述 符 就 可 以 找到 其 对 应 的 套 接 字数 据 
结构 。 每 个 进程 在 自己 的 进程 空间 里 都 有 一 个 套 接 字 描述 符 表 ， 但 是 套 接 字 数据 结构 都 存放 在 操作 系统 的 内 核 缓冲 里 。 
































2.bind 函 数 











正如 上 面 所 说 bind () 函数 把 一 个 地 址 族 中 的 特定 地 址 赋 给 socket。 例 如 对 应 AF INET、AF_INET6 就 是 把 一 个 ipv4 或 ipv6 地 址 和 端口 号 组 合 赋 给 socket。bind 的 函数 原型 是 : 








int bind (int sockfd, const struct sockaddr *addr, socklen t addrlen); 





函数 的 3 个 参数 分 别 如 下 所 述 。 


(1) sockfd: 即 socket 描 述 字 ， 它 是 通过 socket () 函数 创建 来 唯一 标识 一 个 socket 的 。bind () 函数 就 是 将 给 这 个 描述 字 绑 定 一 个 名 字 。 


(2) addr: 一 个 const struct sockaddr* 指 针 ， 指 向 要 绑 定 给 sockfd 的 协议 地 址 。 这 个 地 址 结构 根据 地 址 创建 socket 时 的 地 址 协议 族 的 不 同 而 不 同 ， 如 ipv4 对 应 的 是 如 下 所 示 的 代码 : 





struct sockaddr in ( 
sa family t sin family; /* address family: AF INET */ 
in port t sin port;  /* port in network byte order */ 
struct in addr sin addr; /* internet address */ 


/* Internet address. */ 
struct in addr ( 
uint32 t s addr; /* address in network byte order */ 


H 





ipv6 对 应 的 代码 如 下 : 





struct sockaddr in6 { 
Sa family t sin6 family; /* AF INET6 */ 


in port t sin6 port; /* port number */ 

uint32 t sin6 flowinfo; /* IPv6 flow information */ 
struct in6 addr sin6 addr; /* IPv6 address */ 
uint32 t ^ sin6 scope id; /* Scope ID (new in 2.4) */ 


HN 
struct in6 addr ( 

unsigned char s6 addr[16]; /* IPv6 address */ 
H 


UNIX 域 对 应 的 代码 如 下 : 





#define UNIX PATH MAX 108 

struct sockaddr un { 
sa family t sun family; /* AF UNIX */ 
char sun path[UNIX PATH MAX]; /* pathname */ 

H 





(3) addrlen: 对 应 的 是 地 址 的 长 度 。 




















通常 服务 器 在 启动 的 时 候 都 会 绑 定 一 个 众所周知 的 地 址 (如 ip 地 址 + 端口 号 ) ， 用 于 提供 服务 ， 客 户 就 可 以 通过 它 来 接连 服务 器 ; 而 客户 端 就 不 用 指定 ， 有 系统 自动 分 配 一 个 端口 号 和 自身 的 IP 地 址 组 
合 。 这 就 是 为 什么 通常 服务 器 端 在 调用 listen 之 前 会 调用 bind () ; 而 客户 端 就 不 用 调用 ， 而 是 在 connect () 时 由 系统 随机 生成 一 个 。 




















































































































返回 值 : 如 果 函 数 执行 成 功 ， 返 回 值 为 0， 反 之 为 SOCKET_ERROR。 


3.listen 和 connect 函 数 

















如 果 作 为 一 个 服务 器 ， 在 调用 socket () 、bind () 之 后 就 会 调用 listen () 来 监听 这 个 socket， 如 果 客 户 端 这 时 调用 connect () 发 出 连接 请 求 ， 服 务 器 端 就 会 接收 到 这 个 请 求 。listen 和 connect 的 
函数 原型 是 : 














int listen(int sockfd, int backlog); 
int connect(int sockfd, const struct sockaddr *addr, socklen t addrlen); 





listen 函 数 的 第 一 个 参数 即 为 要 监听 的 socket 描 述 字 ， 第 二 个 参数 为 相应 socket 可 以 排队 的 最 大 连接 个 数 。socket () 函数 创建 的 socket 默 认 是 一 个 主动 类 型 的 ，listen 函 数 将 socket 变 为 被 动 类 型 的 ， 
等 待 客户 的 连接 请 求 。 








connect 函 数 的 第 一 个 参数 即 为 客户 端的 socket 描 述 字 ， 第 二 参数 为 服务 器 的 socket 地 址 ， 第 三 个 参数 为 socket 地 址 的 长 度 。 客 户 端 通过 调用 connect 函 数 来 建立 与 TCP 服 务 器 的 连接 。 

















4.accept 国 数 

















TCP 服 务 器 端 依次 调用 socket () . bind () , listen () 之 后 ， 就 会 监听 指定 的 socket 地 址 了 。TCP 客 户 端 依次 调用 socket () 、connect () 之 后 就 会 向 TCP 服 务 器 发 送 了 一 个 连接 请 求 。TCP 服 务 
器 监听 到 这 个 请 求 之 后 ， 就 会 调用 accept () 函数 取 接 收 请 求 ， 这 样 连接 就 建立 好 了 。 之 后 就 可 以 开始 网 络 /O 操 作 了 ， 即 类 同 于 普通 文件 的 读 写 /O 操 作 。accept 的 函数 原型 是 : 



































int accept(int sockfd, struct sockaddr *addr, socklen t *addrlen); 

















n 





accept 函 数 的 第 一 个 参数 为 服务 器 的 socket 描 述 字 ; 第 二 个 参数 为 指向 struct sockaddr* 的 指针 ， 用 于 返 
核 自动 生成 的 一 个 全 新 的 描述 字 ， 代 表 与 返回 客户 的 TCP 连 接 。 

















客户 端的 协议 地 址 ; 第 三 个 参数 为 协议 地 址 的 长 度 。 如 果 accpet 成 功 ， 那 么 其 返回 值 是 由 内 














注意 : accept 的 第 一 个 参数 为 服务 器 的 socket 描 述 字 ， 是 服务 器 开始 调用 socket () 函数 生成 的 ， 称 为 监听 socket 描 述 字 ; 而 accept 函 数 返回 的 是 已 连接 的 socket 描 述 字 。 一 个 服务 器 通常 仅仅 只 创建 
一 个 监听 socket 描 述 字 ， 它 在 该 服务 器 的 生命 周期 内 一 直 存在 。 内 核 为 每 个 由 服务 器 进程 接受 的 客户 创建 了 一 个 已 连接 socket 描 述 字 ， 当 服务 器 完成 了 对 某 个 客户 的 服务 ， 相 应 的 已 连接 socket 描 述 字 就 被 
关闭 。 






































5.read 和 write 函数 














至 此 服务 器 与 客户 已 经 建立 好 连接 了 ， 可 以 调用 网 络 |/O 进 行 读 写 操作 了 ， 即 实现 了 网 络 中 不 同 进程 之 间 的 通信 。 网 络 I/O 操 作 有 下 面 几 组 : 











read () /write () 

recv () /send () 

readv () /writev () 
recvmsg () /sendmsg () 


recvfrom () /sendto () 














最 常用 的 则 是 read () 和 write () 。read () 的 函数 原型 是 : 








ssize t read (int fd, void *buf, size t count); 














read () 函数 是 负责 从 fd 中 读 取 内 容 。 当 读 取 成 功 时 ，read () 返回 实际 所 读 的 字 节 数 ， 如 果 返 回 的 值 是 0 表示 已 经 读 到 文件 的 结束 了 ， 小 于 0 表示 出 现 了 错误 。 如 果 错 误 为 EINTR 说 明 读 是 由 中 断 引起 
的 ， 如 果 是 ECONNREST 表 示 网 络 连接 出 了 问题 。3 个 参数 分 别 是 : Dsocket 描 述 字 fd; @ 缓 冲 区 buf; 四 缓冲 区 长 度 count。 























write () 的 函数 原型 是 : 





ssize t write (int fd, const void *buf, size t count); 














write () 函数 将 buf 中 的 nbytes 字 节 内 容 写 入 文件 描述 符 fd 成 功 时 返回 写 的 字 节 数 。 失 败 时 返回 -1， 并 设置 errno 变 量 。 在 网 络 程序 中 ， 当 我 们 向 套 接 字 文件 描述 符 写 时 有 两 种 可 能 : @write 的 返回 值 
大 于 0， 表 示 写 了 部 分 或 者 是 全 部 的 数据 ; @ 返 回 的 值 小 于 0， 此 时 出 现 了 错误 。 实 际 中 要 根据 错误 类 型 来 处 理 。 如 果 错 误 为 ELINTR 表 示 在 写 的 时 候 出 现 了 中 断 错 误 。 如 果 为 EPIPE 表 示 网 络 连 接 出 现 了 问题 




















(对 方 已 经 关闭 了 连接 ) 。3 个 参数 分 别 是 : @fd 表 示 socket 描 述 字 ; @buf 表 示 缓 冲 区 ; Gcou 


6.close 函 数 








nt 表示 缓冲 区 长 度 。 




















在 服务 器 与 客户 端 建立 连接 之 后 ， 会 进行 一 些 读 写 操作 ， 完 成 了 读 写 操作 就 要 关闭 相应 的 socket 描 述 字 ， 好 比 操作 完 打开 的 文件 要 调用 close 关 闭 打开 的 文件 。 需 要 包含 的 头 文件 是 : 











#include <unistd.h> 





close 的 函数 原型 是 : 





int close (int fd); 














close 一 个 TCP socket 的 默认 行为 时 ， 会 把 该 socket 标 记 为 以 关闭 ， 然 后 立即 返回 到 调用 进程 。 该 描述 字 不 能 再 由 调用 进程 使 用 ， 也 就 是 说 不 能 再 作为 read 或 write 的 第 一 个 参数 。 


























close 操 作 只 是 使 相应 socket 描 述 字 的 引用 计数 -1， 只 有 当 引 用 计数 为 0 的 时 候 ， 才 会 触发 TCP 客 户 端 向 服务 器 发 送 终止 连接 请 求 。 


6.3 ”实现 一 个 TCP server 














下 面 用 TCP 协 议 编写 一 个 简单 的 服务 器 、 客 户 端 ， 其 中 服务 器 端 一 直 监听 本 机 的 6666 号 端口 




















【 例 6.1】 ”一 个 简单 的 服务 器 和 客户 端 。 


server.cpp 的 代码 是 : 


#include<stdio.h> 
#include<stdlib.h> 
#include<string.h> 
#include<errno.h> 
#include<sys/types.h> 
#include<sys/socket.h> 
#include<netinet/in.h> 
#include<unistd.h> 
#define MAXLINE 4096 
int main(int argc, char** argv) { 
int listenfd, connfd; 
struct sockaddr_in servaddr; 
char buff[4096]; 


int n; 

if( (listenfd = socket(AF INET, SOCK STREAM, 0)) == -1 ){ 
printf ("create socket error: %s (errno: %d)\n",strerror (errno) ,errno) ; 
return 0; 


} 

memset (&servaddr, 0, sizeof (servaddr)); 
servaddr.sin family = AF INET; 

servaddr.sin addr.s addr = htonl(INADDR ANY); 
servaddr.sin port = htons (6666); 


if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -1){ 
printf("bind socket error: $s(errno: $d)Wn",strerror (errno),errno); 
return 0; 

} 

if( listen(listenfd, 10) == -1)( 
printf("listen socket error: $s(errno: $d)W",strerror (errno),errno); 
return 0; 

} 

printf (" 





while (1){ 

if( (connfd = accept (listenfd, (struct sockaddr*)NULL, NULL)) == -1){ 
printf ("accept socket error: %s (errno: %d)",strerror (errno),errno); 
continue; 

} 

n= recv(connfd, buff, MAXLINE, 0); 

buff[n] = 'N0'; 

printf("recv msg from client: $sWn", buff); 

close (connfd); 


close (listenfd); 
return 0; 











。 如 果 收 到 连接 请 求 ， 将 接收 请 求 并 接收 客户 端 发 来 的 消息 ; 客户 端 与 服务 器 端 建立 连接 并 发 送 一 条 消息 。 





client.cpp 的 代码 是 : 





#include<stdio.h> 
#include<stdlib.h> 
#include<string.h> 
#include<errno.h> 
#include<sys/types.h> 
#include<sys/socket.h> 
#include<netinet/in.h> 
#include<arpa/inet.h> 
#include<unistd.h> 
#define MAXLINE 4096 
int main(int argc, char** argv) { 
int sockfd, n; 
char recvline[4096], sendline[4096]; 
struct sockaddr in servaddr; 
if( arge != 2){ 
printf("usage: ./client <ipaddress>\n"); 
return 0; 
} 
if( (sockfd = socket (AF INET, SOCK STREAM, 0)) < 0){ 
printf ("create socket error: $s(errno: $d)Wn", strerror (errno),errno); 
return 0; 
} 
memset (&servaddr, 0, sizeof (servaddr)); 
servaddr.sin family = AF INET; 


servaddr.sin port = htons(6666); 

if( inet pton(AF INET, argv[1], &servaddr.sin addr) <= O)( 
printf ("inet pton error for $sWM",argv[1]); 
return 0; 


if( connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < 0){ 
printf ("connect error: $s(errno: $d)Wn",strerror (errno),errno); 
return 0; 

} 

printf ("send msg to server: M"); 

fgets (sendline, 4096, stdin); 

if( send(sockfd, sendline, strlen(sendline), 0) < O)( 
printf ("send msg error: $s(errno: $d)Wn", strerror(errno), errno); 
return 0; 

} 

close (sockfd) ; 

return 0; 


makefile 的 代码 是 : 


all:server client 
server:server.o 

g++ -g -o server server.o 
client:client.o 

g++ -g -o client client.o 
server.o:server.cpp 

g++ -g -c server.cpp 
client.o:client.cpp 

g++ -g -c client.cpp 
clean:all 

rm all 








执行 make 命 令 后 ， 生 成 server 和 client2 个 可 执行 文件 。 分 别 打开 两 个 终端 窗口 ， 一 个 执行 ./server 命 令 ， 一 个 执行 ./client 127.0.0.1 命 令 ， 表 示 连 上 本 机 的 6666 端 口 ， 执 行 ./server 命 令 的 要 先 执行 。 执 








行 ./client 127.0.0.1 命 令 后 ， 会 提示 说 要 发 给 server 的 内 容 ， 输 入 “hello” 后 ，client 客 户 端 执行 完毕 ， 这 时 可 以 看 到 server 的 那个 终端 窗 

















127.0.0.1 命 令 后 ， 再 输入 “haha” ，server 的 终端 继续 输出 “recv msg from client: haha”。 结 果 如 图 6-21 和 








[sharexuglinux 6 


recv msg from client 


sg trom client 


图 6-21 例 6.1 服 务 端 执行 结果 


sharexu@linux 060115 ./client 127.0.0.1 


end msg to server: 
hello 








6-22 所 示 。 
































输出 “recv msg from client: hello”。 继 续 执行 ./client 


re LI ee T zem 


[sharexu@linux 0601]$ ./client 12 
send msg ET 
haha 
[sharexu@l1inu 


图 6-22 例 6.1 客 户 端 执行 结果 


接着 来 解释 下 server.cpp 和 client.cpp 中 分 别 做 了 些 什 么 。 


server.cpp 中 创建 了 一 个 TCP 的 socket， 并 打印 了 如 果 创 建 失败 时 的 错误 码 如 下 所 示 : 


if( (listenfd = socket (AF INET, SOCK STREAM, 0)) == -1 ){ 
printf ("create socket error: $s(errno: %d)\n",strerror (errno),errno); 
exit(0); 


} 





可 以 在 一 个 终端 执行 ./server 后 ， 再 在 另 一 个 终端 里 执行 ./server， 发 现 第 二 个 终端 里 输出 了 如 下 所 示 的 提示 : 























[sharexuglinux 060 


bind socket error: dd e55 already in useferrno: 
sharexuglinux 0601]5 























该 地 址 已 经 被 使 用 ， 无 法 再 创建 socket。 不 仅 打印 了 错误 码 ， 还 打印 出 了 错误 信息 。strerror (errno) 就 可 以 打印 错误 信息 。 先 把 servaddr 地 址 清空 ， 再 赋值 ， 代 码 是 : 





memset (&servaddr, 0, sizeof (servaddr)); 
servaddr.sin_family = AF_INET; 

servaddr.sin addr.s addr = htonl(INADDR ANY); 
servaddr. sin port - htons (6666); 





INADDR_ANY 就 是 指定 地 址 为 0.0.0.0 的 地 址 ， 这 个 地 址 事实 上 表示 不 确定 地 址 ， 或 “所 有 地 址 ” “任意 地 址 ”。 一 般 来 说 ， 在 各 个 系统 中 均 定义 成 为 0 值 。 

















INADDR_ANY 是 用 于 多 网 卡 的 机 器 上 的 ， 多 网 卡 就 会 有 多 个 I|P 机 器 。 比 如 你 的 机 器 有 3 个 I|P: 192.168.1.1、202.202.202.202 和 61.1.2.3。 如 果 设 置 
serv.sin addr.s addr=inet addr ("192.168.1.1") ; 然后 监听 100 端 口 ， 这 时 其 他 机 器 只 有 连接 到 192.168.1.1: 100 才 能 成 功 ; 连接 202.202.202.202: 100 或 61.1.2.3: 100 都 会 失败 。 如 果 设 置 
serv.sin addr.s addr=htonl (INADDR ANY) ; 的 话 ， 无 论 连接 哪个 IP 都 可 以 连 上 的 。 




















接 下 来 就 是 将 地 址 绑 定 到 listenfd 上 ， 代 码 为 : 





if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -1){ 
printf ("bind socket error: $s(errno: $d)Wn",strerror (errno),errno); 
exit(0); 

} 


监听 这 个 listenfd， 代 码 为 : 


if( listen(listenfd, 10) == -1)( 
printf ("listen socket error: $s(errno: %d)\n",strerror (errno),errno); 
exit(0); 


} 








在 while 循 环 里 持续 接收 包 ， 注 意 ，accept 和 recv 是 都 是 在 while 循 环 里 的 ， 也 就 是 收 到 包 之 后 ， 这 个 fd 就 没 用 了 ， 并 关闭 它 ， 下 一 个 包 重 新 接收 包 。 注 意 ，recv 函 数 接收 到 的 字符 串 是 不 带 \0 "结束 符 
89, printf 输 出 时 必须 得 先 加 上 结束 符 \0" ， 如 下 所 示 。 






































while(1){ 
if( (connfd = accept(listenfd, (struct sockaddr*)NULL, NULL)) == -1){ 
printf ("accept socket error: %s (errno: $d)",strerror(errno),errno); 
continue; 


} 

n = recv(connfd, buff, MAXLINE, 0); 

buff[n] = 'N0'; 

printf("recv msg from client: $sWn", buff); 
close (connfd); 





























客户 端 client.cpp 的 代码 则 简单 得 多 ， 只 需 绑 定 socket 后 ， 直 接 connect 后 即 可 发 包 。 注 意 ， 程 序 中 将 输入 的 ip 地 址 用 inet_pton 函 数 进 行 了 转换 。inet_pton 是 IP 地 址 转换 函数 ， 可 以 在 将 IP 地 址 在 “点 
分 十 进 制 ” 和 “二 进 制 整数 ”之 间 转 换 。inet_pton 函 数 所 需 的 头 文件 是 : 





#include <sys/types.h> 
#include <sys/socket.h> 
#include <arpa/inet.h> 





inet_pton 的 函数 原型 是 : 


int inet pton(int af, const char *src, void *dst); 








这 个 函数 转换 字符 串 到 网 络 地 址 ， 第 一 个 参数 af 是 地 址 族 ， 转 换 后 存在 dst 中 。 





inet pton£&inet addr 的 扩展 ， 支 持 的 多 地 址 族 有 下 面 几 种 。 








1) af=AF_INET，src 为 指向 字符 型 的 地 址 ， 即 ASCII 的 地 址 的 首 地 址 (ddd.ddd.ddd.ddd 格 式 的 ) ， 函 数 将 该 地 址 转换 为 in_addr 的 结构 体 ， 并 复制 在 *dst 中 。 











2) af=AF_INET6，src 为 指向 IPV6 的 地 址 ， 函 数 将 该 地 址 转换 为 in6_addr 的 结构 体 ， 并 复制 在 *dst 中 。 





如 果 函 数 出 错 将 返回 一 个 负 值 ， 并 将 errno 设 置 为 FAFNOSUPPORT， 如 果 参 数 af 指定 的 地 址 族 和 src 格 式 不 对 ， 函 数 将 返回 0。 











64 TCP 协 议 选项 











TCP 头 部 的 选项 部 分 是 为 了 TCP 适 应 复杂 的 网 络 环境 和 更 好 地 服务 于 应 用 层 而 进行 设计 的 。TCP 选 项 部 分 最 长 可 以 达到 40 Byte， 再 加 上 TCP 选 项 外 的 固定 的 20 Byte 部 分 ，TCP 的 最 长 头 部 可 达 60 
Byte。TCP 头 部 长 度 可 以 通过 TCP 头 部 中 的 “数据 偏 移 ”位 来 查看 。 值 得 注意 的 是 : TCP 偏 移 量 的 单位 是 32bit， 也 就 是 4 Byte。 而 TCP 偏 移 量 共 占 4bit， 取 最 大 的 1111 (B) 计算 也 就 是 十 进 制 的 15。15*4 
Byte=60 Byte， 这 个 也 是 TCP 的 首部 不 超过 60 Byte 的 原因 。 























TCP 选 项 部 分 实际 运用 的 有 以 下 几 种 。 
(1) SO_REUSEADDR。 
(2) SO_RECVBUF/SO_SNDBUF。 


(3) SO_KEEPALIVE。 


(4) SO_LINGER。 
(5) TCP_CORK, 
(6) TCP_NODELAY。 


(7) TCP_DEFER_ACCEPT。 





(8 


TCP_KEEPCNT、TCP_KEEPIDLE 和 TCP_KEEPINTVL。 


(9) SO_SNDTIMEO 和 SO_RCVTIMEO。 


(10) SO_RCVBUF 和 SO_SNDBUF。 


1.50 REUSEADDR 





一 般 来 说 ， 一 个 端口 


释放 后 会 等 待 两 分 钟 左右 




















后 才能 再 被 使 














, 而 使 


























socket， 才 可 以 重复 绑 定 使 用 。 














server 程 序 总 是 应 该 在 调用 bind () 之 前 设置 SO_REUSEADDR 套 接 字 选项 。TCP 先 调 


SO_REUSEADDR 提 供 了 以 下 4 个 功能 。 





1) SO_REUSEADDR 人 允许 
bind 时 将 出 错 。 


启动 一 个 监听 服务 器 并 捆绑 其 众所周知 的 端 





2) SO_REUSEADDR 人 允许 在 同一 端 
3) SO_REUSEADDR 人 允许 单个 进程 捆绑 同一 端 


4) SO_REUSEADDR 人 允许 完全 重复 的 捆绑 : 当 一 个 IP 地 址 和 端 


UDP 套 接口 而 言 (TCP 不 支持 多 播 ) 











上 启动 同一 服务 器 的 多 个 实例 ， 只 要 每 个 实例 捆绑 一 个 不 


SO_REUSEADDR 则 可 以 让 端口 








close 








释放 后 立即 就 可 以 被 























次 使 用 。SO_REUSEADDR 
() 的 一 方 会 进入 TIME_WAIT 状 态 。 


























做 它们 的 本 











以 前 建立 的 将 此 端 | 
































的 本 地 IP 地 址 即 可 。 对 

















到 多 个 套 接 








E, 











只 要 每 个 进程 捆绑 的 指定 不 同 的 本 地 IP 地 址 即 可 。 


n 


的 连接 仍 存 在 。 这 通常 是 





于 对 TCP 套 接 字 处 于 TIME_WAIT 状 态 下 的 





启 监 听 服 务 器 时 会 出 现 的 情况 ， 若 不 设置 此 选项 ， 则 





于 TCP， 根 本 不 可 能 同时 启动 捆绑 相同 |P 地 址 和 相同 端口 

















绑 定 到 某 个 套 接 











tiP 地 址 和 端口 捆绑 型 








上 时 ， 还 允许 





SO_REUSEPORT 和 SO_REUSEADDR 有 类 似 的 功能 ，SO_REUSEPORT 选 项 有 如 下 语义 。 


1) 此 选项 允许 完全 重复 捆绑 ， 





但 只 有 在 想 捆绑 相同 |P 地 址 和 端 





的 套 接 


都 指定 了 此 套 接口 ; 























2) 如 果 被 捆绑 的 IP 


在 所 有 TCP 服 务 器 中 ， 在 调用 bind 之 前 设置 SO_REUSEADDR 套 接口 














IP 地 址 捆绑 。 





法 如 下 所 示 : 





也 址 是 一 个 多 播 地 址 ， 则 SO_REUSEADDR 和 和 





0SO_REUSEPORT 等 效 。 














选项 ， 当 编写 一 个 同一 





if (setsockopt(fd, SOL SOCKET, SO REUSEADDR, (const void *)&nOptval , sizeof(int)) < 0) 


另 一 个 套 接 口 


时 刻 在 同一 主机 上 可 运行 多 次 的 多 播 应 
































http: //www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/... 


在 编写 TCP/SOCK_STREAM 服 务 程序 时 ，SO_REUSEADDR 这 个 套 接 字 选 项 会 通知 内 核 ， 如 果 端 口 忙 ， 但 TCP 状 态 位 于 TIME_WAIT 状 态 ， 则 可 以 重用 端 
后 想 立即 重启 ， 而 新 套 接 字 依 旧 使 用 同一 端口 
相关 五 元 组 构成 : 协议 、 
启 后 的 服务 程序 有 可 能 收 到 非 期 望 数据 。 综 上 所 述 ， 必 须 慎重 








端口 
望 数据 到 达 ， 都 可 能 导致 服务 程序 
本 地 本 地 地 址 、 本 地 端口 




















以 重 























时 依旧 会 得 到 一 个 错误 信息 ， 














]; 如 果 端 





省 





号 的 多 个 服务 器 。 


上 。 一 般 来 说 ， 这 个 特性 仅 在 支持 多 播 的 系统 上 才 有 ， 而 且 只 对 


程序 时 ， 设 置 SO_REUSEADDR 选 项 ， 并 将 本 组 的 多 播 地 址 作为 本 地 











亡 ， 而 TCP 状 态 位 于 其 他 状态 ， 重 



































指明 “地 址 已 经 使 








中 ”。 如 果 服 务 程序 停止 


























反应 混乱 ， 不 过 这 只 是 一 种 可 能 ,对 


， 整 个 相关 五 元 组 还 是 唯一 确定 的 。 所 以 ， 野 


2.TCP NODELAY/TCP CHORK 


在 网 络 拥塞 控制 领域 ， 有 一 个 非常 有 名 的 算法 叫 作 Nagle 算 法 (Nagle algorithm) ， 这 是 使 
的 网 络 拥塞 问题 (RFC 896) 。 该 问题 的 
Telnet 连 接 到 远程 
Byte+TCP 头 20 Byte) 的 额外 开销 ， 这 种 有 效 载 荷 (payload) 利用 率 极 








载 。 比 如 ， 当 
3k ( 即 IP 头 20 


户 使 









































实 上 可 能 性 较 小 。 一 个 套 接 字 由 






































低下 的 情况 被 统称 之 为 电大 窗 

















说 ， 可 能 还 可 以 接受 ， 但 是 对 于 重负 载 的 


针对 上 面 提 到 的 这 个 状况 ，Nagle 算 法 的 改进 在 了 





包 ; 为 了 某 些 对比 说 明 ， 还 有 中 包 


数据 包 报 文 段 的 ACK 确 认为 止 ， 或 当 


络 而 言 ， 就 极 有 可 能 承载 不 了 而 轻易 发 生 拥塞 瘫痪 。 











， 即 长 度 
当前 字符 

















TCP 中 的 Nagle 算 法 默认 是 启 
的 就 立即 发 送 。 


TCP_NODELAY 和 TCP_CORK 基 本 上 控制 了 包 的 “Nagle 化 ”，Nagle 化 在 这 和 


行为 需求 不 同 而 已 。 








三 : 如 果 发 送 端 欲 多 次 发 送 包 含 少量 字符 的 数据 包 (一 般 情 况 下 ， 后 
比 小 包 长 ,但 又 不 足 一 个 MSS 的 包 ) ， 则 发 送 端 会 先 将 第 一 个 小 包 发 送出 去 ， 
属于 紧急 数据 ， 或 者 积攒 到 了 一 定数 量 的 数据 (比如 缓存 的 字符 数据 已 经 达到 


的 ,但 是 它 并 不 是 适合 任何 情况 ， 对 于 telnet 或 rlogin 这 样 的 远程 登录 应 | 




















TCP_NODELAY 不 使 








当 在 传送 大 量 数据 的 时 候 ， 为 了 提高 TCP 发 送 效率 ， 可 以 设置 TCP_ CORK，CORK 就 是 “ 塞 子 ” 的 意思 ， 


自动 传送 。 





后 ， 数 据 就 会 





3.SO LINGER 


linger 是 延迟 延缓 的 意思 ， 


Nagle 算 法 ， 不 会 将 小 包 进 行 拼接 成 大 包 








H 








而 将 





























的 确 比较 适合 








进行 发 送 ， 而 是 直接 将 小 包 发 送出 去 ， 这 会 














这 里 的 延缓 是 指 面向 连接 的 socket 的 close 操 作 。 默 认 close 立 即 返回 





它 的 发 明 人 John Nagle 的 名 字 来 命名 的 ，John Nagle 在 1984: 
体 描述 是 : 如 果 应 用 程序 一 次 产生 1 Byte 的 数据 ， 而 这 个 1 Byte 数 据 又 以 网 络 数据 包 的 形式 发 送 到 远 端 服务 器 ， 那 么 就 很 容易 导致 网 络 
肛 务 器 时 ， 每 一 次 按键 操作 就 会 产生 1 Byte 数 据 ， 进 而 发 送出 去 一 个 数据 包 ， 所 以 在 典型 情况 下 ， 传 送 一 个 只 拥有 1 Byte 有 效 数据 的 数据 包 ， 却 要 发 费 40 Byte 长 包 
口 症候 群 (Silly Window Syndrome) 。 可 以 看 到 


























。 但 必须 意识 到 ， 此 时 任何 非 期 





， 此 时 使 
本 地 地 址 、 





SO_REUSEADDR 选 项 非常 有 
本 地 端口 、 











远程 


出 址 、 远 程 端口 





。SO_REUSEADDR 仅 仅 表 示 可 




















使 用 SO_REUSEADDR 选 项 。 

















d 
F 首 次 





这 个 算法 来 尝试 解决 福特 汽车 公司 














由 于 太 多 的 数据 包 而 过 

















， 这 种 情况 对 于 轻 负载 的 网 络 来 





统一 称 长 度 小 于 MSS 的 数据 包 为 小 包 ; 与 此 相对 ， 称 长 度 等 于 MSS 的 数据 包 为 大 
后 面 到 达 的 少量 字符 数据 都 缓存 起 来 而 不 立即 发 送 ， 直 到 
数据 包 报 文 段 的 最 大 长 度 ) 等 多 种 情况 才 将 其 组 成 一 个 较 大 的 数据 包 发 送出 去 。 





收 到 接收 端 对 前 一 个 






































原本 就 是 为 此 而 设计 ) ， 但 是 在 某 些 应 





得 用 户 体验 要 好 。 














SO_LINGER 可 以 改变 close 的 行为 。 控 制 SO_LINGER 通 过 下 面 一 个 结构 : 


struct linger( 





int 1 onoff; /*0-off, nonzero-on*/ 


H 


int l linger; /*linger time, POSIX specifies units as seconds*/ 


场景 下 却 又 需要 关闭 它 ， 有 需要 发 送 


的 含义 是 采用 Nagle 算 法 把 较 小 的 包 组 装 为 更 大 的 帧 。TCP_NODELAY 和 TCP_CORK 都 禁 掉 了 Nagle 算 法 ， 只 不 过 它们 的 


它 会 尽量 在 每 次 发 送 最 大 的 数据 量 。 当 设置 了 TCP_CORK 后 ,会 有 200ms 阻 塞 ， 当 阻塞 时 间 过 


， 但 是 当 发 送 缓冲 区 中 还 有 一 部 分 数据 的 时 候 ， 系 统 将 会 尝试 将 数据 发 送 给 对 端 。 





(1) 通过 结构 体 中 成 员 的 不 同 赋值 ， 可 以 表现 为 下 面 几 种 情况 。 














1) Lonoff 设 置 为 0， 选 项 被 关闭 。|_linger 值 被 忽略 ,就 是 上 面 的 默认 情形 ，close 立 即 返回 。 





2) |_onoff 设 置 为 非 0，|_linger 被 设置 为 0%， 则 close () 不 被 阻塞 立即 执行 ， 丢 弃 socket 发 送 缓冲 区 中 的 数据 ， 并 向 对 端 发 送 一 个 RsT 报 文 。 这 种 关闭 方式 称 为 “强制 ”或 “失效 ”关闭 。 这 种 方式 ， 是 
非 正 常 的 4 种 握手 方式 结束 TCP 的 连接 ， 所 以 ，TCP 连 接 将 不 会 进入 TIME_WAIT 状 态 ， 这 样 会 导致 新 建立 的 可 能 和 已 经 连接 的 数据 造成 混乱 。 









































3) Lonoff 设 置 为 非 0，|_linger 被 设置 为 非 0， 则 close () 调用 阻塞 进程 ， 直 到 所 剩 数据 发 送 完毕 或 超时 。 这 种 关闭 称 为 “优雅 地 ”关闭 ， 在 这 种 情况 下 ，close 的 返回 得 到 延迟 。 调 用 close 去 关闭 
socket 的 时 候 ， 内 核 将 会 延迟 。 也 就 是 说 ， 如 果 send buffer 中 还 有 数据 尚未 发 送 ， 该 进程 将 会 被 休眠 直到 以 下 任何 一 种 情况 发 生 : (send buffer 中 的 所 有 数据 都 被 发 送 并 且 得 到 对 方 TCP 的 应 答 消息 (这 
种 应 答 并 不 是 意味 着 对 方 应 用 程序 已 经 接收 到 数据 ， 在 后 面 shutdown 中 将 会 具体 讲解 ) ; @ 延 迟 时 间 消 耗 完 ， 在 延迟 时 间 被 消耗 完 之 后 ，send buffer 中 的 所 有 数据 都 将 会 被 丢弃 。 



























































上 面 @、@ 两 种 情况 中 ， 如 果 socket 被 设置 为 0 NONBLOCK 状 态 ， 程 序 将 不 会 等 待 close 返 回 ，send buffer 中 的 所 有 数据 都 将 会 被 丢弃 。 所 以 需要 判断 close 的 返回 值 。 在 send buffer 中 的 所 有 数据 
都 被 发 送 之 前 并 且 延 迟 时 间 没有 消耗 完 ，close 返 回 的 话 ，close 将 会 返回 一 个 WOULDBLOCK 的 提示 。 


Qus 



































这 个 选项 需要 谨慎 使 用 ， 尤 其 是 强制 式 关闭 ， 可 能 会 丢失 服务 器 发 给 客户 端的 最 后 一 部 分 数据 。 


(2) 实例 说 明 。 


1) close 默 认 操 作 : 立即 返回 。 











此 种 情况 ，close 立 即 返回 ， 如 果 send buffer 中 还 有 数据 ，close 将 会 等 到 所 有 数据 被 发 送 完 之 后 返回 。 由 于 并 没有 等 待 对 方 TCP 发 送 的 ACK 信 息 ， 所 以 只 能 保证 数据 已 经 发 送 到 对 方 ， 所 以 并 不 知道 对 
方 是 否 已 经 接受 了 数据 。 由 于 此 种 情况 ，TCP 连 接 终止 是 按照 正常 的 4 次 挥手 方式 ， 需 要 经 过 TIME_WAIT， 默 认 情况 下 数据 流向 如 图 6-23 所 示 。 


服务 器 









































write data 
Close 


Close returns FIN 


Data queued by TCP 


ACK of data and FIN 





Application reads queued 
data and FIN close 


FIN 


ACK of data and FIN 


2) |_onoff 非 0， 并 且 使 之 |_linger 为 一 个 整数 。 








图 6-23 ”默认 close 时 客户 端 和 服务 器 的 数据 流向 


















































在 这 种 情况 下 ，close 会 在 接收 到 对 方 TCP 的 ACK 信 息 之 后 才 返 回 〈|_linger 消 耗 完 之 前 ) 。 但 是 这 种 ACK 信 息 只 能 保证 对 方 已 经 接收 到 数据 ， 并 不 保证 对 方 应 用 程序 已 经 读 取 数 据 ， 如 图 6-24 所 示 。 


write data 
Close | 


Data queued by TCP 


Application reads queued 
data and FIN close 


Close returns 


ACK of data and FIN 


| 


图 6-24 ”1_onoff 和 ]_linger 都 非 0 时 close 客 户 端 和 服务 器 的 数据 流向 
3) Llinger 设 置 值 太 小 。 


这 种 情况 ， 由 于 |_linger 值 太 小 ， 在 send buffer 中 的 数据 都 发 送 完 之 前 ，close 就 返回 ， 此 种 情况 终止 TCP 连 接 ， 更 |_linger= 0 类 似 ，TCP 连 接 终止 不 是 按照 正常 的 4 步 握手 ， 所 以 ，TCP 连 接 不 会 进入 
TIME WAIT 状态， 那么 ，client 会 向 server 发 送 一 个 RST 信 息 ， 如 图 6-25 所 示 。 











A 


write data 


Close FIN 


Data queued by TCP 





Close returns-I with error 
EWOULDBLOCK 


Application reads queued 
data and FIN close 


FIN 


l 
I 
| ACK of data and FIN 
| 
| ACK of data and FIN 


图 6-25 1 linger 设 置 值 太 小 时 close 客 户 端 和 服务 器 的 数据 流向 


4) shutdown 等 待 应 用 程序 读 取 数据 。 














同上 面 的 2) 进行 对 比 ， 调 用 shutdown 后 紧 接 着 调用 read， 此 时 read 会 被 阻塞 ， 直 到 接收 到 对 方 的 FIN 标 志 ， 也 就 是 说 read 是 在 服务 器 端的 应 用 程序 调用 close 之 后 才 返 回 的 。 当 服务 器 端 应 用 程序 读 
取 到 来 自 client 的 数据 和 FIN 标 志 之 后 ， 服 务 器 端 会 进入 CLOSE_WAIT 状 态 ， 那 么 ， 如 果 此 时 服务 器 端 要 断 开 该 TCP 连 接 ， 需 要 服务 器 端 应 用 程序 调用 一 次 close， 也 就 意味 着 向 client 发 送 一 次 FIN 标 志 。 这 
个 时 候 ， 说 明 服 务 器 端的 应 用 程序 已 经 读 取 到 client 发 送 的 数据 和 FIN 标 志 ，read 会 在 接收 到 服务 器 端的 FIN 之 后 返回 。 所 以 ，shutdown 可 以 确保 服务 器 端 应 用 程序 已 经 读 取 数 据 了 ， 而 不 仅仅 是 服务 器 端 
已 经 接收 到 数据 而 已 ，shutdown 时 的 数据 流向 如 图 6-26 所 示 。 

















































































































shutdown 参 数 有 : 


@SHUT_RD 指 调用 shutdown 的 一 端 receive buffer 将 被 丢弃 掉 ， 无 法 接收 数据 ， 但 是 可 以 发 送 数据 ，send buffer 的 数据 可 以 被 发 送出 去 ; 


























@SHUT_WR 指 调用 shutdown 的 一 端 无 法 发 送 数据 ， 但 是 可 以 接收 数据 。 该 参数 表示 不 能 调用 send. 但 是 如 果 还 有 数据 在 send buffer 中 ， 这 些 数据 还 是 会 被 继续 发 送出 去 的 。 























4.TCP_DEFER_ACCEPT 




















defer accept， 从 字面 上 理解 是 推迟 接收 ， 实 际 上 是 当 接收 到 第 一 个 数据 之 后 ， 才 会 创建 连接 。 对 于 像 HTTP 等 非 交 互 式 的 服务 器 ， 这 个 很 有 意义 ， 可 以 用 来 防御 空 连接 攻击 (只 是 建立 连接 ， 但 是 不 发 
送 任何 数据 ) 。 




















write data 


Shut down FIN 


read blocks 





read returns 0 


FIN 


图 6-26  shutd. 








使 用 方法 如 下 : 








ACK of data and FIN 


ACK of data and FIN 





own 时 close 客 户 端 和 服务 器 的 数据 流向 


Data queued by TCP 


Application reads queued 
data and FIN close 





val = 5; 
setsockopt(srv socket-»fd, SOL TCP, TCP DEFER ACCEPT, &val, sizeof(val)) ; 




















里 面 val 的 单位 是 秒 (s) ， 注 意 如 果 打开 这 个 功能 ，kernel 在 val 时 间 之 内 还 没有 收 到 数据 ， 不 会 继续 唤醒 进程 ， 而 是 直接 丢弃 连接 。 如 果 服 务 器 设置 TCP_DEFER_ACCEPT 选 项 后 ， 服 务 器 受到 一 个 














CONNECT 请 求 并 进行 了 3 次 握手 之 后 ， 新 的 socket 状 态 依然 为 SYN_RECV， 而 不 是 ESTABLISHED， 操 作 系统 不 会 接收 数据 。 


由 于 设置 TCP_DEFER_ACCEPT 选 项 之 后 ，3 次 握手 后 状态 没有 达到 ESTABLISHED， 而 是 SYN_RECV。 这 个 时 候 ， 如 果 客 户 端 一 直 没 有 发 送 数据 报 文 ， 服 务 器 将 和 





























netipv4.TCP synack _retries 参 数控 制 ， 达 到 重 传 次 数 之 后 ， 才 会 再 次 进行 setsockopt 中 设置 的 超时 值 ， 因 此 会 出 现 SYN_RECV 生 存 时 间 比 设置 值 大 一 些 的 情况 。 





5.SO KEEPALIVE 











SO_KEEPALIVE 用 于 保持 连接 检测 对 方 主机 是 否 崩 溃 ， 避 免 (服务 器 ) 永远 阻塞 于 TCP 连 接 的 输入 。 




















E(ESYN/ACKIRX, 


Mimi 





HERAS 


(1) 设置 该 选项 后 ， 如 果 2h 内 在 此 套 接口 的 任 一 方向 都 没有 数据 交换 ，TCP 就 自动 给 对 方 发 一 个 保持 存活 探测 分 节 (keepalive probe) 。 这 是 一 个 对 方 必 须 响应 的 TCP 分 节 . 它 会 导致 以 下 3 种 情况 。 























A 


对 方 接收 一 切 正 常 : 以 期 望 的 ACK 响 应 ，2h 后 ，TCP 将 发 出 另 一 个 探测 分 节 。 





Ww 


对 方 无 任何 响应 : 源 自 berkeley 的 TCP 发 送 另外 8 个 探测 分 节 ， 相 隔 75s 一 个 ， 试 图 


2) 对 方 已 崩溃 上 且 已 重新 启动 : 以 RST 响 应 。 套 接口 的 待 处 理 错误 被 置 为 ECONNR-ESET， 套 接口 本 身 则 被 关闭 。 








套 接口 本 身 则 被 关闭 。 如 ICMP 提 示 的 错误 是 host unreachable (主机 不 可 达 ) ,说明 对 方 主机 并 没有 崩 演 , 


(2) 有 关 SO_KEEPALIVE 的 3 个 参数 详细 解释 如 下 所 述 。 


A 


tcp_keepalive_intv|， 保 活 探测 消息 的 发 送 频率 。 默 认 值 为 75s。 











N 


Qus 


只 有 设置 了 SO_KEEPALIVE 套 接口 选项 后 才 会 发 送 保 活 探测 消息 。 





得 到 一 个 响应 。 在 发 出 第 一 个 探测 分 节 11min 15s 后 若 仍 无 响应 就 放弃 。 套 接 


发 送 频率 tcp_keepalive_intv| 乘 以 发 送 次 数 tcp_keepalive_probes， 就 得 到 了 从 开始 探测 直到 放弃 探测 确定 连接 断 开 的 时 间 ， 大 约 为 11min。 





tcp_keepalive_probes，TCP 发 送 保 活 探测 消息 以 确定 连接 是 否 已 断 开 的 次 数 ， 其 默认 值 为 9 (次 ) 。 


3) tcp keepalive time， 在 TCP 保 活 打开 的 情况 下 ， 最 后 一 次 数据 交换 到 TCP 发 送 第 一 个 保 活 探测 消息 的 时 间 ， 即 允许 的 持续 空闲 时 间 ， 其 默认 值 为 7200s (2h) 。 














的 待 处 理 错误 被 置 为 ETIMEOUT， 


但 是 不 可 达 ， 这 种 情况 下 待 处 理 错 误 被 置 为 EHOST-UNREACH 状 态 。 








设置 SO_KEEPALIVE 选 项 来 开启 KEEPALIVE， 然 后 通过 TCP_KEEPIDLE、TCP_KEE-PINTVL 和 TCP_KEEPCNT 设 置 keepalive 的 开始 时 间 、 间 隔 、 次 数 等 参数 ， 使 用 方法 如 下 : 

















// Setting For KeepAlive 

int keepalive = 1; 

setsockopt (incomingsock, SOL SOCKET,SO KEEPALIVE, (void*) (&keepalive), (socklen t)sizeof (keepalive)); 

int keepalive time = 30; ` T bi 

setsockopt(incomingsock, IPPROTO TCP, TCP KEEPIDLE, (void*) (&keepalive time), (socklen t)sizeof (keepalive time)); 
int keepalive intvl = 3; u xx T i 
setsockopt(incomingsock, IPPROTO TCP, TCP KEEPINTVL, (void*) (&keepalive intvl), (socklen t)sizeof(keepalive intvl)); 
int keepalive probes- 3; i T i u 
setsockopt(incomingsock, IPPROTO TCP, TCP KEEPCNT, (void*) (&keepalive probes), (socklen t)sizeof(keepalive probes)); 











当然 ， 也 可 以 通过 设置 /proc/sys/net/ipv4/tcp_keepalive_time、tcp_keepalive_intvl 和 tcp_keepalive_probes 等 内 核 参数 来 达到 目的 ， 但 是 这 样 的 话 ， 会 影响 所 有 的 socket， 因 此 建议 使 
setsockopt 设 置 。 




















6.SO_SNDTIMEO 和 SO_RCVTIMEO 


SO_SNDTIMEO 和 SO_RCVTIMEO 两 项 分 别 设置 socket 的 发 送 和 接收 超时 时 间 ， 它 们 都 接收 一 个 timeval 结 构 作 为 参数 ， 当 timeval 结 构 为 0 时 ， 表 示 选 项 无 效 。 接 收 超 时 会 影响 read、readv、recv、 


recvfrom 和 recvmsg 的 状态 ; 发 送 超时 会 影响 write、writev、send、sendto 和 sendmsg 的 状态 。 
【 例 6.2】 ”超时 时 间 设 置 举 例 。 


client.cpp 的 代码 是 : 





#include<stdio.h> 
#include<stdlib.h> 
#include<string.h> 
#include<errno.h> 
#include<sys/types.h> 
#include<sys/socket.h> 
#include<netinet/in.h> 
#include<arpa/inet.h> 
#include<unistd.h> 
#define MAXLINE 4096 
int main(int argc, char** argv) { 
int connfd, n; 
char recvline[4096], sendline[4096]; 
struct sockaddr in servaddr; 
if( argc !- 2){ 
printf("usage: ./client <ipaddress>\n"); 
return 0; 
} 
if( (connfd = socket (AF INET, SOCK STREAM, 0 
printf("create socket error: $s(errno: % 
return 0; 


)) « Ot 
d) \n", strerror (errno),errno); 


l 
memset(&servaddr, 0, sizeof(servaddr)); 
servaddr.sin family = AF INET; 
servaddr.sin port = htons (6666); 
if( inet pton(AF INET, argv[1], &servaddr.sin addr) <= 0){ 
printf("inet pton error for $sW",argv[1]); 
return 0; 
l 
if(connect(connfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) « O)( 
printf ("connect error: $s(errno: $d)WMn",strerror (errno),errno); 
return 0; 
} 
struct timeval stTimeValStruct; 
stTimeValStruct.tv sec - 2; 
stTimeValStruct.tv usec = 0; 
if(setsockopt(connfd, SOL SOCKET, SO SNDTIMEO , &stTimeValStruct, sizeof (stTime 
ValStruct)))[ e ni 
printf("setsockopt error: $s(errno: $d) Wn", strerror (errno),errno); 
return 0; 


} 
if(setsockopt(connfd, SOL SOCKET, SO RCVTIMEO , &stTimeValStruct, sizeof (stTime 
ValStruct)))( 
printf("setsockopt error: $s(errno: $d)Wn", 
return 0; 


strerror (errno),errno); 


l 

ssize t writelen; 

char sendMsg[10] = ( 'O', '1', '2', '3', '4', '5', '6', '7', '8', 'NO'); 

int count = 0; 

writeLen = write(connfd, sendMsg, sizeof (sendMsg)); 

if (writeLen < 0) ( 
printf ("write error: $s(errno: $d)Wn", strerror (errno),errno); 
close (connfd) ; 
return 0; 

} 

else{ 

printf ("write sucess, writelen :%d, sendMsg:%s\n",writeLen,sendMsg); 

} 

char readMsg[10]={ 

int readlen- read( 

if (readlen < 0) ( 
printf ("read error: $s(errno: $d)Wn", strerror(errno),errno); 
close (connfd); 
return 0; 


0}; 
connfd, readMsg, sizeof (readMsg) ) ; 


else{ 
readMsg[9]= '\0'; 
printf ("read sucess, readlen :%d, readMsg:%s\n", readlen, readMsg) ; 


close (connfd) ; 
return 0; 





server.cpp 的 代码 是 : 





fincludecstdio.h» 
fincludecstdlib.h» 
fincludecstring.h» 
ftinclude«errno.h» 
finclude«sys/types.h» 
finclude«sys/socket.h» 
finclude«netinet/in.h» 
ftinclude«unistd.h» 
#define MAXLINE 4096 
int main(int argc, char** argv)( 
int listenfd, acceptfd; 
struct sockaddr in servaddr; 
if( (listenfd = socket(AF INET, SOCK STREAM, 0)) == -1 )( 
printf ("create socket error: $s(errno: $d)Wn",strerror (errno),errno); 
return -1; 
l 
memset(&servaddr, 0, sizeof(servaddr)); 
servaddr.sin family = AF INET; 
servaddr.sin addr.s addr = htonl(INADDR ANY); 
servaddr.sin port = htons (6666); 
if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -1){ 
printf ("bind socket error: %s (errno: $d)Wn",strerror (errno),errno); 
return -1; 


} 


if( listen(listenfd, 10) == -1){ 
printf ("listen socket error: $s(errno: %d)\n",strerror (errno) ,errno) ; 
return -1; 





printf (" =waiting for client's request======\n"); 
if( (acceptfd = accept(listenfd, (struct sockaddr*)NULL, NULL)) == 


1) 
printf("accept socket error: $s(errno: $d)" Te (er 


{ 
),errno); 
} 
char recvMsg [100]; 
ssize t readLen = read(acceptfd, recvMsg, sizeof (recvMsg)); 
if (readLen « 0) ( 

printf ("read error: $s(errno: $d)Wn",strerror (errno),errno); 

return -1; 


} 

recvMsg[9]='\0'; 

printf ("readLen:%d, recvMsg:%s\n" ,readLen, recvMsg); 

sleep (5); 

recvMsg[1]='9'; 

ssize t writeLen = write(acceptfd, recvMsg, sizeof (recvMsg)); 

printf("writelen:$d, sendMsg:$sWn" ,writelen, recvMsg); 

if (writeLen < 0) ( 
printf ("writeLen error: $s(errno: $d)Wn",strerror (errno),errno); 
return -1; 

} 

close (acceptfQ) ; 

return 0; 





了 2s 之 后 ， 发 现 client 这 边 提 示 “read error: Resource temporarily unavailable (errno: 11) " , 


makefile 的 代码 是 : 


all:server client 


server:server.o 


g++ -g -o server server.o 


client:client.o 


g++ -g -o client client.o 


server.o:server.cpp 


g++ -g -c server.cpp 


client.o:client.cpp 


gt -g -c client.cpp 


clean:all 


rm all 














执行 make 命 令 后 ， 生 成 server 和 client 2 个 可 执行 文件 ， 分 别 打开 两 个 终端 窗口 ， 一 个 执行 ./server 命 令 ， 一 个 执行 ./client 127.0.0.1 命 令 ， 表 示 连 上 本 机 的 6666 端 口 ， 并 且 ./server 命 令 要 先 执行 。 执 




















[ 





6-28 所 示 。 


[sharexuglinux 


write 


me i “i 


rexu@linux 


-Wadlt 
en 


图 6-28 ” 例 6.2 服 务 端 执行 结果 





来 看 下 程序 里 分 别 都 有 哪些 功能 。 














dlient.cpp 中 ， 下 面 这 些 都 为 连 上 服务 端 56666 端 口 的 相关 代码 : 











if( (connfd = socket(AF INET, SOCK STREAM, 0)) < 0){ 


} 


printf ("create socket error: %s (errno: %d)\n", strerror (errno),errno); 
return 0; 


memset (&servaddr, 0, sizeof (servaddr)); 
servaddr.sin_family = AF_INET; 

servaddr.sin port = htons (6666) ; 

if( inet pton (AF INET, argv[1], &servaddr.sin addr) <= 0){ 


} 


printf(" inet pton error for $sWM",argv[l D; 
return 0; 


if(connect(connfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < 0){ 


} 


printf ("connect error: %s (errno: %d)\n",strerror (errno) ,errno); 
return 0; 


下 面 则 是 设置 了 发 送 的 超时 时 间 和 接收 的 超时 时 间 为 2s。 也 就 是 说 ， 如 果 接 收 一 个 包 超过 2 









































还 没收 到 ， 就 会 断 开 连 接 ， 相 关 代码 如 下 : 


了 有 过 了 3s 之 后 ，server 这 边 提示 "writeLen: 100, sendMsg: 092345678" , 


行 ./client 127.0.0.1 命 令 后 ,会 输出 “write sucess, writelen: 10, sendMsg: 012345678”， 表 示 已 经 发 送 了 一 个 包 给 server。 此 时 server 这 边 也 输出 了 "readLen: 10, recvMsg: 012345678" , 过 





执行 结果 如 











到 6-27 和 








struct timeval stTimeValStruct; 


stTimeValStruct.tv sec - 2; 
stTimeValStruct.tv usec = 0; 


if (setsockopt (connfd, SOL SOCKET, SO SNDTIMEO , &stTimeValStruct, sizeof (stTime 
ValStruct)))[ 


printf("setsockopt error: $s(errno: %d)\n", strerror(errno),errno); 


return 0; 


H 


if(setsockopt(connfd, SOL SOCKET, SO RCVTIMEO , &stTimeValStruct, sizeof (stTime 


ValStruct)))( 
printf("setsockopt error: $s(errno: $d)Wn", strerror(errno),errno); 
return 0; 





如 下 是 往 服务 端 发 012345678 的 字符 串 的 相关 代码 : 





ssize t writelen; 

char sendMsg[10] = ( "Os '1', '2', '3', '4', 'S5', '6', '7', 'B8', 'N0'); 

int count = 0; 

writeLen = write(connfd, sendMsg, sizeof (sendMsg)); 

if (writeLen < 0) ( 
printf ("write error: $s(errno: $d)Wn", strerror(errno),errno); 
close (connfd); 
return 0; 

} 

else{ 

printf ("write sucess, writelen :$d, sendMsg:%s\n",writeLen,sendMsg); 


} 





下 面 是 接收 来 自 服务 端的 回 包 的 相关 代码 : 


char readMsg[10]-(0); 
int readlen- read (connfd, readMsg, sizeof (readMsg) ) ; 
if (readlen < 0) { 
printf ("read error: $s(errno: $d)Wn", strerror(errno),errno); 
close (connfd) ; 
return 0; 
} 
elset 
readMsg[9]- 'N0'; 
printf ("read sucess, readlen :$d, readMsg:$sW",readlen, readMsg) ; 























在 servercpp 中 ， 如 下 是 在 绑 定 端口 和 准备 收 包 的 相关 代码 : 





if( (listenfd = socket(AF INET, SOCK STREAM, 0)) == -1 ){ 
printf ("create socket error: $s(errno: $d)WM",strerror (errno),errno); 
return -1; 

} 

memset (&servaddr, 0, sizeof (servaddr)); 

servaddr.sin family = AF INET; 

servaddr.sin addr.s addr = htonl(INADDR ANY); 


servaddr.sin port = htons(6666); 


if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -1){ 
printf ("bind socket error: $s(errno: $d)Wn",strerror (errno),errno); 
return -1; 

} 

if( listen(listenfd, 10) == -1){ 


printf ("listen socket error: %s (errno: $d)Wn",strerror (errno),errno); 
return -1; 


printf ("======waiting for client's request------An"); 
if( (acceptfd = accept(listenfd, (struct sockaddr*)NULL, NULL)) == -1){ 
printf ("accept socket error: $s(errno: $d)",strerror(errno),errno); 


} 











下 面 是 先 收 100 个 字 节 ， 休 眠 5s， 把 收 到 的 字符 串 中 的 第 2 个 字 节 改 成 9， 然 后 把 新 字符 串 发 出 去 的 相关 代码 : 








char recvMsg[100]; 

ssize t readLen = read(acceptfd, recvMsg, sizeof (recvMsg)); 

if (readLen « 0) ( 
printf ("read error: $s(errno: $d)WMn",strerror (errno),errno); 
return -1; 


} 

recvMsg[9]='\0'; 

printf ("readLen:%d, recvMsg:%s\n" ,readLen, recvMsg); 

sleep (5); 

recvMsg[1]='9'; 

ssize t writeLen = write(acceptfd, recvMsg, sizeof (recvMsg)); 

printf ("writeLen:$d, sendMsg:%s\n" ,writeLen, recvMsg); 

if (writeLen < 0) ( 
printf ("writeLen error: $s(errno: $d)Wn",strerror (errno),errno); 
return -1; 




















也 就 是 说 ， 客 户 端 给 服务 端 发 了 一 个 请 求 ， 服 务 端 休 眠 5s 之 后 再 给 客户 端 回 包 。 但 是 因为 客户 端 设置 的 收 包 超 时 时 间 只 是 2s， 所 以 客户 端 收 包 失败 了 ， 关 闭 了 连接 。 





7.SO_RCVBUF 和 SO SNDBUF 



























































从 写 一 个 TCP 套 接 字 的 write 调用 成 功 后 返回 ， 仅 仅 表示 可 以 重新 使 用 原来 的 应 用 进程 缓冲 区 了 ， 并 不 代表 对 端 TCP 或 应 用 进程 已 接收 到 数据 。 对 端 TCP 必 须 确认 收 到 的 数据 ， 伴 随 来 自 对 端的 ACK 的 不 
断 到 达 ， 本 端 TCP 至 此 才能 从 套 接 字 发 送 缓冲 区 中 丢弃 已 确认 的 数据 。TCP 必 须 为 已 发 送 的 数据 保留 一 个 副本 ， 直 到 它 被 对 端 确认 为 止 。UDP 不 保存 应 用 进程 数据 的 副本 ， 因 此 无 需 一 个 真正 的 发 送 缓冲 
区 ，write 调 用 成 功 返 回 表示 所 写 的 数据 报 或 其 所 有 分 片 已 被 加 入 数据 链 路 层 的 输出 队列 。 






































回 









































对 于 read 调 用 ( 套 接 字 标 志 为 阻塞 ) ， 如 果 接 收 缓冲 区 中 有 20 Byte 空 间 ， 请 求 读 100 Byte 的 数据 ， 就 会 返回 20。 对 于 write 调 用 ( 套 接 字 标志 为 阻塞 ) ， 如 果 请 求 写 100 Byte 的 数据 ， 而 发 送 缓冲 区 中 
只 有 20 Byte 的 空闲 位 置 ， 那 么 write 会 阻塞 ， 直 到 把 100 Byte 的 数据 全 部 交 给 发 送 缓冲 区 才 返 回 ， 如 果 write 中 得 套 接 字 标 志 为 非 阻塞 ， 则 直接 返回 20， 因 此 可 以 实现 自己 的 readn 和 writen 函 数 。 


























每 个 TCP 套 接 字 都 有 一 个 发 送 缓冲 区 和 一 个 接收 缓冲 区 ， 每 个 UDP 套 接 字 都 有 一 个 接收 缓冲 区 。 使 用 SO_RCVBUF 和 SO_SNDBUF 这 两 个 套 接口 选项 可 以 改变 默认 缓冲 区 大 小 。 


























【 例 6.3】 ”发 送 缓冲 区 和 接收 缓冲 区 的 展示 。 


client.cpp 的 代码 是 : 





#include<stdio.h> 
#include<stdlib.h> 
#include<string.h> 
#include<errno.h> 
#include<sys/types.h> 
#include<sys/socket.h> 
#include<netinet/in.h> 
#include<arpa/inet.h> 
#include<unistd.h> 
#define MAXLINE 4096 
int main(int argc, char** argv) { 
int connfd, n; 
char recvline[4096], sendline[4096]; 
struct sockaddr in servaddr; 
if( arge != 2){ 
printf("usage: ./client <ipaddress>\n"); 
return 0; 


if( (connfd = socket(AF INET, SOCK STREAM, 
printf("create socket error: $s(errno: 
return 0; 


0) < Ot 
$d) Wn", 


} 

memset(&servaddr, 0, sizeof (servaddr)); 

servaddr.sin family = AF INET; 

servaddr.sin port = htons(6666); 

if( inet pton(AF INET, argv[1], &servaddr.sin addr) <= 0){ 
printf("inet pton error for $sW",argv[1]); 
return 0; 


} 


if (connect (connfd, (struct sockaddr*)&servaddr, sizeof (servadar)) 


strerror (errno) , errno); 


< 0){ 


printf ("connect error: $s(errno: %d)\n",strerror (errno) ,errno); 


return 0; 


} 


ssize_t writeLen; 


char sendMsg[246988] = {0}; 
int count = 0; 
while (1){ 
counttt; 
if (count == 5) ( 
return 0; 
} 
writeLen = write(connfd, sendMsg, sizeof (sendMsg)); 


if (writeLen < 0) { 
printf ("write failed\n"); 
close (connfd) ; 


return 0; 


else( 
printf ("write sucess, writelen:$dWn",writelen); 


} 


close (connfd) ; 
return 0; 





server.cpp 的 代码 是 : 





#include<stdio.h> 
#include<stdlib.h> 
#include<string.h> 
#include<errno.h> 
#include<sys/types.h> 
#include<sys/socket.h> 
#include<netinet/in.h> 
#include<unistd.h> 
#define MAXLINE 4096 
int main(int argc, char** argv) { 
int listenfd, acceptfd; 
struct sockaddr_in servaddr; 


if( (listenfd = socket(AF INET, SOCK STREAM, 0)) )t 


printf ("create socket error: $s(errno: $d)Wn",strerror (errno),errno); 


return -1; 
} 
memset (&servaddr, 0, sizeof (servaddr)); 
servaddr.sin family = AF INET; 
servaddr.sin addr.s addr = htonl(INADDR ANY); 
servaddr.sin port htons (6666) ; 
if( bind(listenfd, (struct sockaddr*)&servaddr, 


sizeof (servaddr)) 


== -1){ 


printf ("bind socket error: %s (errno: %d)\n",strerror (errno),errno); 


return -1; 
} 
if( listen (listenfd, 


10) = -1){ 


printf ("listen socket error: %s (errno: %d)\n",strerror (errno), 


return -1; 
} 
printf( 
if( (acceptfd = accept (listenfd, 

printf("accept socket error: 
Jelse( 

printf ("accept succWn"); 

int rcvbuf len; 

socklen t len = 

if( getsockopt( 

perror("getsockopt: " ); 





—waiting for client's request An") ; 
(struct sockaddr*)NULL, NULL)) 


sizeof (rcvbuf len); 


} 


} 
char recvMsg[246988]={0}; 
ssize t totalLen = 
while (1) ( 
sleep(1); 
ssize t readLen 
printf ("readLen: 
if (readLen < 0) ( 
perror("read: "); 
return -1; 


printf("the recv buf len: $dW" , rcvbuf len ); 





read(acceptfd, recvMsg, sizeof (recvMsg)); 
ld\n", readLen) ; 


else if (readLen == 0) ( 
printf ("read finish: len = $ ld\n",totalLen); 
close (acceptfd) ; 
return 0; 

} 

else{ 


totalLen += readLen; 


} 
close (acceptfd) ; 
return 0; 


errno); 


=1)4 


s (errno: $d)",strerror(errno),errno); 


acceptfd, SOL SOCKET, SO RCVBUF, (void *)&rcvbuf len, &len ) < 0 ) 1{ 





makefile 的 代码 是 : 





all:server client 
server:server.o 


g++ -g -o server server.o 
client:client.o 

g++ -g -o client client.o 
server.o:server.cpp 

g++ -g -c server.cpp 
client.o:client.cpp 

g++ -g -c client.cpp 


clean:all 
rm all 





执行 make 命 令 后 ， 生 成 server 和 client2 个 可 执行 文件 。 分 别 打开 两 个 终端 窗口 











图 


行 ./client 127.0.0.1 命 令 后 ， 两 个 终端 的 展示 结果 如 图 6-29 和 图 6-30 所 示 : 

















， 一 个 执行 ./server 命 令 ， 一 个 执行 ./client 127.0.0.1 命 令 ， 表 示 连 上 本 机 的 6666 端 口 





， 执 行 ./server 命 令 的 要 先 执行 。 执 





[sharexu@linux 060315 
write sucess, writelen:? 3988 
write sucess, Writelen: 
write sucess, writelen 
, Writelen: 
XUGLImUX 060315 














server 


client's reguest 


rēad finish: len = 
[sharexu@linux 0603] 





图 6-30 例 6.3 服 务 端 执行 结果 











本 例 中 ， 服 务 端 只 负责 收 包 ， 所 以 程序 server.cpp 中 打印 了 接收 缓冲 区 的 大 小 ， 代 码 是 : 


if( getsockopt( acceptfd, SOL SOCKET, SO RCVBUF, (void *)&rcvbuf len, &len ) < 0 ){ 
perror("getsockopt: " ); 


} 








注意 ，perror 也 可 以 打印 出 相应 的 错误 日 志 。 

















由 程序 的 执行 结果 来 看 ， 接 收 缓冲 区 的 大 小 是 87380 Byte。 





本 例 中 ， 服 务 端 并 不 是 一 直 在 收 包 ， 而 是 每 收 一 次 之 后 ， 就 休眠 一 次 ， 代 码 是 : 


while (1) ( 
sleep(1); 
ssize t readLen = read(acceptfd, recvMsg, sizeof (recvMsg)); 
printf("readLen:$ ldWn",readLen); 
if (readLen < 0) ( 
perror("read: "); 
return -1; 


} 
else if (readLen == 0) { 
printf ("read finish: len = % ld\n",totalLen); 
close (acceptfd) ; 
return 0 
} 
else( 
totalLen += readLen; 


而 客户 端 却 是 一 直 不 间断 地 发 包 ， 一 共 发 4 个 包 ， 每 个 包 中 发 送 246988 Byte, 





ssize t writelen; 
char sendMsg[246988] = (0); 


int count = 07 
while (1)( 
counttt; 
if (count == 5) { 
return 0; 
} 
writeLen = write(connfd, sendMsg, sizeof (sendMsg)); 
if (writeLen < 0) { 
printf ("write failed\n"); 
close (connfd) ; 
return 0; 
l 
elset 
printf ("write sucess, writelen:$dWn",writelen); 
} 
} 








也 就 是 说 ， 客 户 端 发 给 了 服务 端 数据 ， 但 服务 端 此 时 却 还 没有 接收 完毕 就 休眠 了 ， 等 休眠 完毕 ， 会 继续 收 包 。 最 终 ， 也 把 客户 端 发 过 来 的 246988*4=987952 Byte 全 部 接收 完了 。 而 这 些 未 接收 的 数 
据 ， 就 是 存储 在 接收 缓冲 区 里 的 。 

















6.5 ”网 络 字 节 序 与 主机 序 

















关于 字 节 序 ， 前 面 第 1 章 已 有 所 提 过 ， 这 里 再 稍微 做 下 分 析 。 不 同 的 CPU 有 不 同 的 字 节 序 类 型 ， 这 些 字 节 序 是 指 整数 在 内 存 中 保存 的 顺序 ， 称 为 主机 序 。 最 常见 的 有 两 种 : @Little Endian， 将 低 序 字 节 
存储 在 起 始 地 址 ; @Big Endian， 将 高 序 字 节 存储 在 起 始 地 址 。 











Little Endian 把 地 址 低位 存储 值 的 低位 ， 地 址 高 位 存储 值 的 高 位 。Little endian 是 最 符合 人 类 思维 的 字 节 序 ， 是 因为 从 人 的 第 一 观感 来 说， 低位 值 小 ， 就 应 该 放 在 内 存 地 址 小 的 地 方 ， 也 即 内 存 地 址 低 
位 ， 反 之 ， 高 位 值 就 应 该 放 在 内 存 地 址 大 的 地 方 ， 也 即 内 存 地 址 高 位 。 

















Big Endian 把 地 址 低位 存储 值 的 高 位 ， 地 址 高 位 存储 值 的 低位 。Big Endian 很 直观 ， 因 为 它 不 需 考虑 对 应 关系 ， 只 需要 把 内 存 地 址 从 左 到 右 按照 由 低 到 高 的 顺序 写 出 ， 把 值 按照 通常 的 高 位 到 低位 的 顺 
序 写 出 ， 两 者 对 照 ， 一 个 字 节 一 个 字 节 的 填充 进去 即 可 。 



































网 





文字 说 明 可 能 比较 抽象 ， 下 面 


Big Endian 
低地 址 高 地 址 











像 加 以 说 明 。 比 如 数字 0x12345678 在 两 种 不 同 字 节 序 CPU 中 的 存储 顺序 如 图 6-31 所 示 。 




















Little Endian 
低地 址 i UE 





| 78 | 56 | 34 | 1] | 


图 6-31 Big Endian 和 Little Endian 的 存储 示意 区 























为 什么 要 注意 字 节 序 的 问题 呢 》 当 然 ， 如 果 程 序 只 在 单机 环境 下 运行 ， 并 且 不 和 其 他 程序 打交道 ， 那 么 完全 可 以 忽略 字 节 序 的 存在 ; 但 是 ， 如 果 程 序 要 跟 其 他 程序 产生 交互 呢 ， 此 时 就 一 定 需要 注意 写 
字 节 序 的 问题 。C/C+ + 语言 编写 的 程序 里 数据 存储 顺序 是 跟 编译 平台 所 在 的 CPU 相关 的 ， 而 Java 编 写 的 程序 则 唯一 采用 Big Endian 方 式 来 存储 数据 。 试 想 ， 如 果 你 用 C/C+ + 语言 在 x86 平 台 下 编写 的 程序 跟 
别人 的 Java 程 序 互通 时 会 产生 什么 结果 ?就 拿 上 面 的 0x12345678 来 说 ， 将 指向 0x12345678 的 指针 传 给 了 Java 程 序 ， 由 于 JAVA 采取 Big Endian 方 式 存储 数据 ， 很 自然 会 将 你 的 数据 翻译 为 0x78563412。 因 
此 ， 在 你 的 C 程 序 传 给 java 程序 之 前 有 必要 进行 字 节 序 的 转换 工作 。 

























































































无 独 有 偶 ， 所 有 网 络 协议 也 都 是 采用 Big Endian 的 方式 来 传输 数据 的 。 所 以 有 时 也 会 把 Big Endian 方 式 称 之 为 网 络 字 节 序 。 当 两 台 采 用 不 同 字 节 序 的 主机 通信 时 ， 在 发 送 数据 之 前 都 必须 经 过 字 节 序 的 
转换 成 为 网 络 字 节 序 后 再 进行 传输 。 











6.6 封包 和 解 包 



































TCP 是 个 “ 流 ” 协议， 所 谓 流 ， 就 是 没有 界限 的 一 串 数据 。 大 家 可 以 将 其 想象 河 里 的 流水 ， 是 连 成 一 片 的 ， 其 间 是 没有 分 界线 的 。 但 一 般 通信 程序 开发 是 需要 定义 一 个 个 相互 独立 的 数据 包 的 ， 比 如 用 
于 登录 的 数据 包 、 用 于 注销 的 数据 包 等 。 由 于 TCP “ 流 ” 的 特性 以 及 网 络 状况 ， 在 进行 数据 传输 时 假设 我 们 连续 调用 两 次 send 分 别 发 送 两 段 数据 datal 和 data2， 在 接收 端 有 以 下 几 种 接收 情况 (当然 不 止 这 
几 种 情况 ， 这 里 只 列 出 了 有 代表 性 的 情况 ) 。 












































(1) 先 接收 到 data1， 然 后 接收 到 data2。 

(2) 先 接收 到 data1 的 部 分 数据 ， 然 后 接收 到 data1 余 下 的 部 分 以 及 data2 的 全 部 。 

(3) 先 接收 到 了 data1 的 全 部 数据 和 data2 的 部 分 数据 ， 然 后 接收 到 了 data2 的 余下 的 数据 。 
(4) 一 次 性 接收 到 了 data1 和 data2 的 全 部 数据 。 


对 于 (1) 这 种 情况 正 是 我 们 需要 的 ， 不 再 做 讨论 。 对 于 (2) 、 (3) 和 (4) 的 情况 就 是 常 说 的 “ 粘 包 ”， 就 需要 把 接收 到 的 数据 进行 拆 包 ， 拆 成 一 个 个 独立 的 数据 包 ; 而 为 了 拆 包 就 必须 在 发 送 端 进 
行 封包 。 


对 于 UDP 来 说 就 不 存在 拆 包 的 问题 ， 因 为 UDP 是 个 "数据 包 "协议 ， 也 就 是 两 段 数据 间 是 有 界限 的 ， 在 接收 端 要 么 接收 不 到 数据 要 么 就 是 接收 一 段 完整 的 数据 ， 不 会 少 接收 也 不 会 多 接收 。 








为 什么 会 出 现 (2) 、 (3) 和 (4) 的 情况 呢 ， 有 以 下 几 点 原因 。 








1) 由 Nagle 算 法 造成 的 发 送 端的 粘 包 。 前 面 有 提 到 Nagle 算 法 是 一 种 改善 网 络 传输 效率 的 算法 ， 但 也 可 能 造成 困扰 。 简 单 来 说 ， 当 要 提交 一 段 数据 给 TCP 发 送 时 ，TCP 并 不 立刻 发 送 此 段 数 据 ， 而 是 等 
待 一 小 段 时 间 ， 看 看 在 等 待 期 间 是否 还 有 要 发 送 的 数据 ， 若 有 则 会 一 次 把 多 段 数据 发 送出 去 。 像 (3) 和 (4) 的 情况 就 有 可 能 是 Nagle 算 法 造成 的 。 















































2) 接收 端 接收 不 及 时 造成 的 接收 端 粘 包 。TCP 会 把 接收 到 的 数据 存在 自己 的 缓冲 区 中 ， 然 后 通知 应 用 层 取 数据 。 当 应 用 层 由 于 某 些 原因 不 能 及 时 取出 TCP 的 数据 ， 就 会 造成 TCP 缓 冲 区 中 存放 了 多 段 数 





























“ 粘 包 ” 可 发 生 在 发 送 端 也 可 发 生 在 接收 端 。 











最 初 遇 到 " 粘 包 " 的 问题 时 ， 大 家 可 能 觉得 可 以 在 两 次 send 之 间 调 用 sleep 来 休眠 一 小 段 时 间 ， 以 此 来 解决 。 这 个 解决 方法 的 缺点 是 显而易见 的 : 使 传输 效率 大 大 降 
包 和 拆 包 ， 就 能 解决 这 个 问题 。 





ud 


乓 ， 而 且 也 并 不 可 靠 。 对 数据 包 进 行 封 











封包 就 是 给 一 段 数据 加 上 包头 ， 这 样 一 来 数据 包 就 分 为 包头 和 包 体 两 部 分 内 容 了 (以 后 讲 过 滤 非 法 包 时 会 如上“ 包 尾 ” 内容 ) 。 包 头 其 实 上 是 个 大 小 固定 的 结构 体 ， 其 中 有 个 结构 体 成 员 变 量 表示 包 体 
的 长 度 ， 这 是 个 很 重要 的 变量 ， 其 他 的 结构 体 成 员 可 根据 需要 自己 定义 。 根 据 固 定 的 包头 长 度 以 及 包头 中 含有 的 包 体 长 度 的 变量 值 就 能 正确 的 拆 分 出 一 个 完整 的 数据 包 。 












































利用 底层 的 缓冲 区 来 进行 拆 包 时 ， 由 于 TCP 也 维护 了 一 个 缓冲 区 ， 所 以 可 以 利用 TCP 的 缓冲 区 来 缓存 发 送 的 数据 ， 这 样 一 来 就 不 需要 为 每 一 个 连接 分 配 一 个 缓冲 区 了 ， 对 于 利用 缓冲 区 来 拆 包 ， 也 就 是 
循环 不 停 地 接收 包头 给 出 的 数据 ， 直 到 收 够 为 止 ， 这 就 是 一 个 完整 的 TCP 包 。 









































为 了 解决 “ 粘 包 ”的 问题 ， 大 家 通常 会 在 所 发 送 的 内 容 前 ， 加 上 发 送 内 容 的 长 度 ， 所 以 对 方 就 会 先 收 4 Byte， 解 析 获 得 接 下 来 需要 接收 的 长 度 ， 再 进行 收 包 。 
1. 发 送 与 接收 一 个 字符 串 
【 例 6.4】 ”发 送 与 接收 一 个 字符 串 。 


server.cpp 的 代码 是 : 








#include <sys/types.h> 
#include «sys/socket.h» 
#include <netinet/in.h> 
#include «arpa/inet.h» 
#include <unistd.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <strings.h> 
#include <sys/wait.h> 
#include <string.h> 
#include <errno.h> 
int MyRecv( int iSock, char * pchBuf, size t tCount)( 
size t tBytesRead-0; B 
int iThisRead; 
while (tBytesRead < tCount)( 
do{ 
iThisRead = read(iSock, pchBuf, tCount-tBytesRead); 
] while((iThisRead«0) && (errno--EINTR)); 
if(iThisRead < 0){ 
return (iThisRead); 
}else if (iThisRead == 0) 
return (tBytesRead); 
tBytesRead += iThisRead; 
pchBuf += iThisRead; 
) 


l 
#define DEFAULT PORT 6666 
int main( int argc, char ** argv)( 
int sockfd,acceptfd; /* 监听 socket: sock fd, 数据 传输 Socket: acceptfd */ 
struct sockaddr in my addr; /* 本 机 地 址 信息 */ 
struct sockaddr : in their addr; /* 客户 地 址 信息 */ 
unsigned int sin size, myport-6666, lisnum-10; 
if ((sockfd = socket(AF INET , SOCK STREAM, 0)) 一 -1) ( 
perror("socket" ); 7 ul 
return -1; 








} 
printf ("socket ok \n") 
my_addr.sin | family-AF 1 INET; 
my addr. sin | port-htons (DEFAULT | PORT); 
my addr.sin addr.s addr = INADDR ANY; 
bzero(& &(my : addr.sin | zero), 0); 
if (bind(sockfd, (struct sockaddr *)&my addr, sizeof(struct sockaddr )) — -1) ( 
perror("bind" ); 
return -2; 
} 
printf ("bind ok Wn"); 
if (listen(sockfd, lisnum) == -1) { 
perror("listen" ); 
return -3; 
} 
printf ("listen ok Wn"); 
char recvMsg[10]; 
sin size = sizeof (my addr); 
acceptfd = accept (sockfd, (struct sockaddr *)&my addr,&sin size); 
if (acceptfd « 0) ( w 
close (sockfd); 
printf ("accept failedWn" ) 
return -4; 
l 
ssize t readLen = MyRecv(acceptfd, recvMsg, sizeof( int)); 
if (readLen < 0) ( 
printf ("read failedW" ); 
return -1; 
} 
int len-( int)ntohl (*( int*)recvMsg); 
printf ("len:%d\n", len); 
readLen = MyRecv (acceptfd, recvMsg, len); 
if (readLen < 0) ( 
printf ("read failed\n" ) 
return -1; 


} 

recvMsg[len]-'N0'; 
printf("recvMsg:$sWMn" ,recvMsg); 
close (acceptfQ) ; 

return 0; 





client.cpp 的 代码 是 : 





#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <errno.h> 
int MySend( int iSock, char * pchBuf, size_t tLen)( 
int iThisSend; 
unsigned int iSended-0; 
if(tLen == 0) 
return (0); 
while (iSended«tLen)( 
dot 
iThisSend = send(iSock, pchBuf, tLen-iSended, 0); 
} while((iThisSend«0) && (errno--EINTR)); 
if(iThisSend < 0){ 
return (iSended); 


} 

iSended += iThisSend; 

pchBuf += iThisSend; 
} 


return (tLen); 


l 
#define DEFAULT PORT 6666 
int main( int argc, char * argv[]){ 
int connfd - 0; 
int cLen - 0; 
struct sockaddr in client; 
if(argc < 2){ 
printf(" Uasge: clientent [server IP address] Wn"); 
return -1; 
} 
client.sin family = AF INET; 
client.sin port = htons (DEFAULT PORT); 
client.sin addr.s addr = inet addr(argv[1]); 
connfd = socket(AF INET, SOCK STREAM, 0); 
if(confd < O)( ` a 
printf("socket() failure!WMn" ); 
return -1; 
} 
if(connect(connfd, (struct sockaddr*)&client, sizeof(client)) < O)( 
printf("connect() failure! Wn" ); 
return -1; 
} 
ssize t writeLen; 
char *sendMsg = "0123456789"; 
int tLen-strlen (sendMsg); 
printf("tLen:$dWMn" ,tLen); 
int iLen-0; 
char * pBuff- new char [100]; 
* (int*) (pBuff*iLen)- htonl(tlen); 
iLent-sizeof( int); 
memcpy (PBuff+iLen, sendMsg, tLen) ; 
iLen+=tLen; 
writeLen= MySend(connfd, pBuff, iLen); 
if (writeLen « O) ( 
printf ("write failedWn" ); 
close (connfd) ; 
return 0; 





} 
else{ 
printf ("write sucess, writelen :$d, sendMsg:%s\n",writeLen,sendMsg); 


close (connfd) ; 
return 0; 





makefile 的 代码 是 : 





all:server client 
server:server.o 

g++ -g -o server server.o 
client:client.o 

g++ -g -o client client.o 
Server.o:server.cpp 

g++ -g -c server.cpp 
client.o:client.cpp 

g++ -g -c client.cpp 
clean:all 

rm all 



































本 例 中 ， 客 户 端 给 服务 端 发 送 了 一 个 字符 串 ， 但 是 由 于 双方 都 不 知道 这 个 字符 串 会 有 多 长 ， 所 以 用 发 送 的 数据 的 前 面 4 个 字 节 表 示 这 个 字符 串 的 大 小 。 








ssize t writelen; 

char *sendMsg - "0123456789"; 
int tLen-strlen (sendMsg); 
printf("tLen:$dWMn" ,tLen); 

int iLen-0; 

char * pBuff- new char [100]; 

* (int*) (pBuff*iLen)- htonl(tlen); 
iLent-sizeof( int); 

memcpy (PBuff+iLen, sendMsg, tLen); 
iLent-tLen; 

















注意 ， 一 般 要 把 字符 串 的 长 度 转换 成 网 络 字 节 序 ， 由 于 发 送 的 内 容 是 字符 串 ， 则 无 需 转换 网 络 字 节 序 ， 直 接 加 在 后 面 即 可 。 发 送 时 ， 由 于 事先 并 不 指定 要 发 送 的 数据 是 多 大 ， 所 以 写 了 个 函数 ， 可 以 发 
送 指定 长 度 的 数据 。 一 次 发 送 不 完 ， 可 以 接着 发 送 ， 直 到 发 送 完 指定 长 度 为 止 ， 代 码 如 下 所 示 。 




















int MySend( int iSock, char * pchBuf, size t tLen) 
{ 
int iThisSend; 
unsigned int iSended=0; 
if(tLen == 0) 
return (0); 
while (iSended<tLen) { 
do{ 
iThisSend = send(iSock, pchBuf, tLen-iSended, 0); 
} while((iThisSend«0) && (errno--EINTR)); 
if(iThisSend < 0){ 
return (iSended) ; 


} 
iSended += iThisSend; 
pchBuf += iThisSend; 


return (tLen); 








而 对 于 服务 端 ， 则 需要 先 接收 4 个 字 节 ， 并 把 它 转换 成 主机 序 ， 这 样 才能 知道 接 下 来 是 接收 多 少 字 节 的 数据 ， 如 下 所 示 : 





ssize t readLen = MyRecv(acceptfd, recvMsg, sizeof( int)); 
if (readLen « 0) ( 
printf ("read failedWn" ); 
return -1; 
} 
int len=( int)ntohl(*( int*)recvMsg); 
printf ("len:%d\n", len); 











由 于 事先 并 不 知道 会 接收 多 少 字 节 ， 所 以 也 写 了 一 个 函数 ， 用 于 循环 接收 ， 直 到 接收 完 指 定数 量 为 止 ， 如 下 所 示 : 




















int MyRecv( int iSock, char * pchBuf, size t tCount) 


size t tBytesRead-0; 
int iThisRead; 
while (tBytesRead < tCount)( 
do{ 
iThisRead = read(iSock, pchBuf, tCount-tBytesRead); 
] while((iThisRead«0) && (errno--EINTR)); 
if(iThisRead « O)( 
return (iThisRead); 
} 
else if (iThisRead == 0) 
return (tBytesRead) ; 
tBytesRead += iThisRead; 
pchBuf += iThisRead; 






































接收 完 的 数据 ， 由 于 是 字符 串 ， 所 以 无 需 再 转换 成 主机 序 即 可 使 用 。 注 意 ， 接 收 到 的 数据 并 没有 结束 符 \0 ， 所 以 打印 前 需要 加 上 结束 符 \0 。 


recvMsg[len]-'N0'; 
printf("recvMsg:$sWMn" ,recvMsg); 





程序 执行 结果 如 图 6-32 和 图 6-33 所 示 。 

















那 如 果 是 想 传输 入 的 内 容 是 一 个 结构 体 ， 那 么 应 该 如 果 操作 呢 ? 接 下 来 就 要 介绍 发 送 与 接收 一 个 结构 体 的 问题 。 
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6-33 例 6.4 服 务 端 执 行 结果 











传输 一 个 结构 体内 容 。 


define.h 的 代码 是 : 


#pragma pack(1) 
struct Header { 
int num ; // &id 
int index ; // 学 生 编 号 
H 


struct PkgContent ( 


char sex ; // 性 别 

int score ; // 分 数 

char address [100]; // 地 址 
int age; 


H 
struct Pkg ( 
Header head; 
PkgContent content ; 
H 
int MySend( int iSock, char * pchBuf, size t tLen){ 
int iThisSend; B 
unsigned int iSended-0; 
if(tLen = 0) 
return 0; 
while (iSended«tLen)( 
do{ 
iThisSend = send(iSock, pchBuf, tLen-iSended, 0); 
} while((iThisSend«0) && (errno--EINTR)); 
if (iThisSend < 0){ 
return (iSended) ; 


} 
iSended += iThisSend; 
pchBuf += iThisSend; 
} 
return (tLen); 


} 
int MyRecv( int iSock, char * pchBuf, size t tCount){ 
size t tBytesRead-0; 
int iThisRead; 
while (tBytesRead < tCount)( 
dot 
iThisRead = read(iSock, pchBuf, tCount-tBytesRead); 
} while((iThisRead«0) && (errno--EINTR)); 
if(iThisRead < 0)( 
return (iThisRead); 
} 
else if (iThisRead == 0) 
return (tBytesRead) ; 
tBytesRead += iThisRead; 
pchBuf += iThisRead; 





server.cpp 的 代码 是 : 





#include <sys/types.h> 

#include <sys/socket.h> 

#include <netinet/in.h> 

#include <arpa/inet.h> 

#include <unistd.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <strings.h> 

#include <sys/wait.h> 

#include <string.h> 

#include <errno.h> 

#include "define.h" 

#define DEFAULT_PORT 6666 

int main( int argc, char ** argv) { 
int sockfd,acceptfd; /* 监听 socket: sock_fd, 数据 传输 socket: acceptfd */ 
struct sockaddr in my addr; /* 本 机 地 址 信 
struct sockaddr in their addr; /* 客户 地 址 信息 */ 
unsigned int sin size, myport-6666, lisnum-10; 
if ((sockfd = socket (AF INET , SOCK STREAM, 0)) — -1) ( 

perror("socket" ); 
return -1; 








} 

printf ("socket ok \n"); 

my_addr.sin_family=AF_INET; 

my_addr.sin_port=htons (DEFAULT_PORT) ; 

my addr.sin addr.s addr = INADDR ANY; 

bzero(&(my addr.sin zero), 0); 

if (bind(sockfd, (struct sockaddr *)&my addr, sizeof(struct sockaddr )) 一 -1) { 
perror("bind" ); 
return -2; 


} 

printf ("bind ok Wn"); 

if (listen(sockfd, lisnum) == -1) ( 
perror("listen" ); 
return -3; 


l 
printf ("listen ok Mn"); 
char recvMsg[1000]; 
sin size = sizeof (my addr); 
acceptfd = accept (sockfd, (struct sockaddr *)&my addr,&sin size); 
if (acceptfd < 0) ( 
close (sockfd) ; 
printf ("accept failedW" ); 
return -4; 
l 
ssize t readLen = MyRecv(acceptfd, recvMsg, sizeof (int)); 
if (readLen < 0) ( 
printf ("read failedWn" ); 
return -1; 


int len-(int)ntohl (* (int*) recvMsg) ; 
printf ("len:$dWn",len); 
readLen = MyRecv(acceptfd, recvMsg, len); 
if (readLen < 0) ( 

printf ("read failedWn" ); 

return -1; 


} 

char * pBuff-recvMsg; 

Pkg RecvPkg; 

int iLen-0; 

memcpy (&RecvPkg.head.num , pBuff + iLen, sizeof( int)); 

iLen += sizeof (int); 

RecvPkg. head. num = ntohl (RecvPkg.head.num); 

printf ("RecvPkg.head.num: d\n" ,RecvPkg.head.num); 

memcpy (&RecvPkg.head.index , pBuff + iLen, sizeof( int)); 
iLen += sizeof (int); 

RecvPkg. head. index = ntohl (RecvPkg.head.index); 
printf("RecvPkg.head.index:$dWn" ,RecvPkg.head.index); 
memcpy(&RecvPkg.content.sex , pBuff + iLen, sizeof( char)); 
iLen += sizeof (char); 

printf("RecvPkg.content.sex:$cWMn" ,RecvPkg.content.sex); 
memcpy (&RecvPkg.content.score , pBuff + iLen, sizeof( int)); 
iLen += sizeof (int); 

RecvPkg. content.score = ntohl(RecvPkg. content.score ); 
printf("RecvPkg.content.score:$dWMn" ,RecvPkg.content.score); 
memcpy (&RecvPkg.content.address, pBuff + iLen, sizeof (RecvPkg.content.address )); 
iLen += sizeof (RecvPkg.content.address); 
printf("RecvPkg.content.address:$sWMn" ,RecvPkg.content.address); 
memcpy(&RecvPkg.content.age , pBuff + iLen, sizeof( int)); 
iLen += sizeof (int); 

RecvPkg.content.age = ntohl (RecvPkg.content.age ); 
printf("RecvPkg.content.age:$dWMn" ,RecvPkg.content.age); 
close (acceptfd) 7 

return 0; 





client.cpp 的 代码 是 : 





finclude <stdio.h> 
finclude <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <errno.h> 
#include "define.h" 
#define DEFAULT_PORT 6666 
int main( int argc, char * argv[]){ 
int connfd = 0; 
int cLen = 0; 
struct sockaddr in client; 
if (argc < 2){ 
printf (" Uasge: clientent [server IP address] Wn"); 
return -1; 
} 
client.sin family = AF INET; 
client.sin port = htons (DEFAULT PORT); 
client.sin addr.s addr = inet addr(argv[1]); 
connfd = socket(AF INET, SOCK STREAM, 0); 
if(confd < 0){ ` es 
printf("socket() failure!WMn" ); 
return -1; 
} 
if(connect(connfd, (struct sockaddr*)&client, sizeof(client)) < 0){ 
printf("connect() failure! Wn" ); 
return -1; 
l 
Pkg mypkg; 
mypkg.head.num-1; 
mypkg.head.index-10001; 
mypkg.content.sex-'m'; 
mypkg.content.score-90; 
char * temp-"guangzhou and shanghai"; 
strnopy (mypkg.content.address, temp, sizeof (mypkg.content.address)); 
mypkg.content.age-18; 
ssize t writelen; 
int tLen-sizeof (mypkg); 
printf("tLen:$dWMn" ,tLen); 
int iLen-0; 
char * pBuff- new char [1000]; 
* (4nt*) (pBuff*iLen)- htonl (tLen); 
iLent-sizeof( int); 
* (int*) (pBu££*iLen)- htonl (mypkg.head.num); 
iLent-sizeof( int); 
* (int*) (pBuff+iLen)= htonl(mypkg.head.index); 
iLent-sizeof( int); 
memcpy (pBuff+iLen, &mypkg.content.sex,sizeof( char)); 
iLent*-sizeof( char); 
* (4nt*) (pBuff*iLen)- htonl (mypkg.content.score); 
iLent-sizeof( int); 
memcpy (pBuff+iLen, mypkg.content .address, sizeof (mypkg.content.address)); 
iLen+= (sizeof (mypkg.content.address)); 
* (int*) (pBuff+iLen)= htonl(mypkg.content.age); 
iLen+=sizeof( int); 
writeLen- MySend(connfd, pBuff, iLen); 
if (writeLen < 0) ( 
printf ("write failedWn" ); 
close (connfd); 
return 0; 





else( 
printf ("write sucess, writelen :$d, iLen:$d, pBuff: $sWn",writeLen,iLen,pBuff); 


close (connfd); 
return 0; 


makefile 的 代码 是 : 


all:server client 
server:server.o 

g++ -g -o server server.o 
client:client.o 

g++ -g -o client client.o 
server. erver.cpp define.h 

g++ -g -c server.cpp 
client.o:client.cpp define.h 

g++ -g -c client.cpp 
clean:all 

rm all 








执行 make 命 令 后 ， 生 成 server 和 client 2 个 可 执行 文件 。 分 别 打开 两 个 终端 窗口 ， 一 个 执行 ./server 命 令 ， 一 个 执行 ./client 127.0.0.1 命 令 ， 表 示 连 上 本 机 的 6666 端 口 ， 并 且 执 行 ./server 命 令 的 要 先 执 
行 。 执 行 结 果 如 图 6-34 和 图 6-35 所 示 。 












































图 6-34 例 6.5 客 户 端 执行 结果 











bind ok 
listen ok 
len:117 
Rec vPkg 


RecvPkKg. 

RecvyPkg 
RecvPkg.content. 
RecvPkg.content.a 
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Ek 6-35 


:guangzhoyu and shanghal 


例 6.5 服 务 器 端 执行 结果 图 


例 6.5 中 ， 由 于 server 和 client 都 将 处 理 同样 的 结构 体内 容 ， 所 以 把 即将 传输 的 结构 体内 容 定义 在 define.h 文 件 中 ， 有 包头 和 包 体 ， 代 码 如 下 所 示 。 





#pragma pack(1) 

struct Header ( 
int num ; 
int index ; 





H 

struct PkgContent ( 
char sex ; // 性 别 
int score ; // 分 数 
char address [100]; // 地 址 
int age; 





HN 

struct Pkg ( 
Header head; 
PkgContent content ; 


这 里 有 一 行 代码 :  "Hpragmapack (1) ”， 这 是 按照 单字 节 对 齐 的 意思 。 如 果 不 加 此 句 ， 则 sizeof (Pkg) 的 值 为 120; 而 如 果 按 照 单 字 节 对 齐 后 ，sizeof (Pkg) 则 为 117。 这 是 为 了 适应 不 同 的 机 器 ， 


服务 器 和 客户 端 都 能 在 对 应 位 置 上 取 到 对 应 的 值 。 





保证 


client.cpp 中 对 结构 体 mypkg 赋 值 后 ， 就 开始 逐个 元 素 进行 网 络 字 节 序 的 转换 。 虽 然 传输 的 结构 体 有 char 数 组 ， 计 算 长 度 时 用 sizeof (结构 体 ) 即 可 ， 方 便 server 收 到 包 时 也 这 样 逐 个 解析 ， 代 码 如 下 所 


int tLen-sizeof (mypkg); 





下 面 是 分 别 对 结构 体 的 每 个 元 素 进行 网 络 字 节 序 的 转换 ， 然 后 复制 到 一 个 char 数 组 里 。 这 里 面 有 char 类 型 的 复制 ， 也 有 char 数 组 类 型 的 复制 ， 代 码 如 下 所 示 。 








* (int*) (pBuff+iLen)= htonl(tlen); 

iLent-sizeof( int); 

* (int*) (pBu££*iLen)- htonl (mypkg.head.num); 
iLent-sizeof( int); 

* (int*) (pBuff+iLen)= htonl (mypkg.head.index); 
iLent-sizeof( int); 

memcpy (pBuff+iLen, &mypkg.content.sex,sizeof( char)); 
iLent-sizeof( char); 

* (int*) (pBufftiLen)- htonl (mypkg.content.score); 
iLent-sizeof( int); 

memcpy (pBuff+iLen, mypkg.content .address, sizeof (mypkg.content.address)); 
iLen+= (sizeof (mypkg.content .address) ) ; 

* (int*) (pBuff+iLen)= htonl(mypkg.content.age); 
iLen+=sizeof( int); 


然后 就 是 发 送 数据 ， 代 码 如 下 所 示 。 


writeLen- MySend(connfd, pBuff, iLen); 
if (writeLen < 0) ( 

printf ("write failedWn" ); 

close (connfd) ; 

return 0; 











server.cpp 中 ， 先 收 4 个 字 节 的 包 ， 然 后 再 将 其 转换 为 主机 序 ， 得 到 接 下 来 该 接收 的 长 度 ， 代 码 如 下 所 示 。 


ssize t readLen = MyRecv(acceptfd, recvMsg, sizeof(int)); 
if (readLen « 0) ( 

printf ("read failed\n" ); 

return -1; 
} 
int len= (int)ntohl (* (int*) recvMsg) ; 
printf ("len:%d\n", len); 
readLen = MyRecv(acceptfd, recvMsg, len); 
if (readLen < 0) ( 

printf ("read failedWn" ); 

return -1; 





收 到 包 后 ， 就 是 把 各 个 元 素 逐 个 解析 出 来 ， 代 码 如 下 所 示 。 





memcpy (&RecvPkg.head.num , pBuff + iLen, sizeof( int)); 
iLen += sizeof (int); 

RecvPkg. head. num = ntohl (RecvPkg.head.num); 
printf("RecvPkg.head.num:$dWMn" ,RecvPkg.head.num); 

memcpy (&RecvPkg.head.index , pBuff + iLen, sizeof( int)); 
iLen += sizeof (int); 

RecvPkg. head. index = ntohl (RecvPkg.head.index); 
printf("RecvPkg.head.index:$dWMn" ,RecvPkg.head.index); 
memcpy(&RecvPkg.content.sex , pBuff + iLen, sizeof( char)); 
iLen += sizeof (char); 

printf("RecvPkg.content.sex:$cWMn" ,RecvPkg.content.sex); 
memcpy(&RecvPkg.content.score , pBuff + iLen, sizeof( int)); 
iLen += sizeof (int); 

RecvPkg. content.score = ntohl(RecvPkg. content.score ); 
printf("RecvPkg.content.score:$dWn" ,RecvPkg.content.score); 
memcpy (&RecvPkg.content.address, pBuff + iLen, sizeof (RecvPkg.content.address )); 
iLen += sizeof (RecvPkg.content.address); 
printf("RecvPkg.content.address:$sWMn" ,RecvPkg.content.address); 
memcpy(&RecvPkg.content.age , pBuff + iLen, sizeof( int)); 
iLen += sizeof (int); 

RecvPkg.content.age = ntohl(RecvPkg.content.age ); 
printf("RecvPkg.content.age:$dWMn" ,RecvPkg.content.age); 


























memcpy 是 C 和 C++ 使 用 的 内 存 拷贝 函数 ， 其 功能 是 从 源 src 所 指 的 内 存 地 址 的 起 始 位 置 开始 拷贝 n 个 字 节 到 目标 dest 所 指 的 内 存 地 址 的 起 始 位 置 中 。 函 数 原型 是 这 样 的 : 








void *memcpy(void *dest, const void *src, size t n); 




















当然 ， 现 在 也 不 用 这 么 麻烦 地 逐个 解析 了 ， 有 protobuff 等 自动 生成 解析 数据 的 函数 ， 这 部 分 内 容 在 后 面 的 章节 将 会 详细 讲解 。 


























67 本章 小 结 


本 章 介绍 了 TCP 协 议 及 网 络 编程 API， 带 大 家 实现 了 一 个 TCP server， 还 介绍 了 TCP 协 议 选 项 、 网 络 字 节 序 和 主机 序 ， 以 及 如 何 封 包 与 解 包 。 熟 练 使 用 这 些 知识 ， 足 以 让 你 轻松 地 写 一 个 server 了。 


不 过 ， 本 章 中 实现 的 server， 在 同一 时 刻 只 能 接收 一 个 包 ， 对 于 互联 网 的 海量 请 求 ， 这 是 远 远 不 够 的 ， 所 以 接 下 来 的 第 7 章 将 继续 探索 如 何 写 出 高 并 发 量 的 server。 


第 7 章 “网络 IO 模型 


IO (Input/Output， 输 入 /输出 ) 是 计算 机 体系 中 重要 的 一 部 分 。IO 类 外 设 有 打印 机 、 键 盘 、 复 印 机 等 ， 存 储 类 型 的 设备 则 有 硬盘 、 磁 盘 、U 盘 等 ， 通 信 设 备 有 网 卡 、 路 由 器 等 。 不 同 的 JO 设备 有 着 不 同 
的 特点 : 数据 率 不 一 样 、 传 送 单位 不 一 样 、 数 据 表示 不 一 样 ， 等 等 。 所 以 ， 很 难 实现 一 种 统一 的 输入 /输出 方法 。 


IO 有 两 种 操作 ， 同 步 1D 和 异步 IO。 同步 ID 指 的 是 ， 必 须 等 待 IO 操作 完成 后 ， 控 制 权 才 返 回 给 用 户 进 程 。 异 步 IO 指 的 是 ， 无 须 等 待 [O 操 作 完成 ， 就 将 控制 权 返 回 给 用 户 进程 。 
网 络 中 的 IO ， 由 于 不 同 的 IO 设备 有 着 不 同 的 特点 ， 网 络 通信 中 往往 需要 等 待 。 常 见 的 有 以 下 4 种 情况 。 

(1) 输入 操作 : 等 待 数据 到 达 套 接 字 接 收 缓冲 区 。 

(2) 输出 操作 : 等 待 套 接 字 发 送 缓冲 区 有 足够 的 空间 容纳 将 要 发 送 的 数据 。 

(3) 服务 器 接收 连接 请 求 : 等 待 新 的 客户 端 连 接 请 求 的 到 来 。 

(4) 客户 端 发 送 连接 请 求 : 等 待 服务 器 回 送 客户 的 发 起 的 SYN 所 对 应 的 ACK。 


当 一 个 网 络 IO 〇 (假设 是 read) 发 生 时 ， 它 会 涉及 两 个 系统 对 象 ， 一 个 是 调用 这 个 IO 的 进程 ， 另 一 个 是 系统 内 核 。 当 一 个 read 操作 发 生 时 ， 它 会 经 历 两 个 阶段 : 加 等 待 数据 准备 ; 加 将 数据 从 内 核 拷 贝 到 进 
程 中 。 


本 章 主 要 讲 网 络 通信 中 的 IO 操作 。 


7.1. 4 种 网 络 IO 模 型 














为 了 解决 网 络 IO 中 的 问题 ， 学 者 们 提出 了 4 种 网 络 IO 模 型 : 阻塞 10 模型 ，@ 非 阻塞 10 模型 ，@ 多 路 |0 复 用 模型 ，@ 异 步 10 模 型 。 











下 面 对 这 4 种 模型 进行 具体 讲解 。 


1. 阻 塞 10 模 型 





在 Linux 中 ， 默 认 情 况 下 所 有 的 socket 都 是 阻塞 的 ， 一 个 典型 的 读 操作 流程 如 图 7-1 所 示 。 
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图 7-1 ”阻塞 IO 模型 



























































阻塞 和 非 阻塞 的 概念 描述 的 是 用 户 线程 调用 内 核 1O 操 作 的 方式 : 阻塞 是 指 IO 操 作 需 要 彻底 完成 后 才 返 回 到 
完成 。 


Es 




















户 空间 ; 而 非 阻 塞 是 指 IO 操 作 被 调用 后 立即 返回 给 用 户 一 个 状态 值 ， 不 需要 等 到 IO 操作 彻底 





















































当 应 用 进程 调用 了 recvfrom 这 个 系统 调用 后 ， 系 统 内 核 就 开始 了 IO 的 第 一 个 阶段 : 准备 数据 。 对 于 网 络 IO 来 说 ， 很 多 时 候 数 据 在 一 开始 还 没 到 达 时 (比如 还 没有 收 到 一 个 完整 的 TCP 包 ) ， 系 统 内 核 就 
要 等 待 足够 的 数据 到 来 。 而 在 用 户 进程 这 边 ， 整 个 进程 会 被 阻塞 。 当 系统 内 核 一 直 等 到 数据 准备 好 了 ， 它 就 会 将 数据 从 系统 内 核 中 拷贝 到 用 户 内 存 中 ， 然 后 系统 内 核 返 回 结果 ， 用 户 进程 才 解 除 阻塞 的 状 
态 ， 重 新 运行 起 来 。 所 以 ， 阻 塞 1O 模 型 的 特点 就 是 在 IO 执行 的 两 个 阶段 (等 待 数据 和 拷贝 数据 ) 都 被 阻塞 了 。 















































































































































大 部 分 的 socket 接 口 都 是 阻塞 型 的 。 所 谓 阻塞 型 接口 是 指 系统 调用 时 (一 般 是 IO 接口 ) 却 不 返回 调用 结果 ， 并 让 当前 线程 一 直 处 于 阻塞 状态 ， 只 有 当 该 系统 调用 获得 结果 或 者 超时 出 错时 才 返 回 结果 。 
实际 上 ， 除 非特 别 指定 ， 几 乎 所 有 的 IO 接口 (包括 socket 接 口 ) 都 是 阻塞 型 的 。 这 给 网 络 编程 带 来 了 一 个 很 大 的 问题 ， 如 在 调用 send () 的 同时 ， 线 程 处 于 阻塞 状态 ， 则 在 此 期 间 ， 线 程 将 无 法 执行 任何 运 
算 或 响应 任何 网 络 请 求 。 

























































































一 个 简单 的 改进 方案 是 在 服务 器 端 使 用 多 线程 或 多 进程 ) 。 多 线程 (或 多 进程 ) 的 目的 是 让 每 个 连接 都 拥有 独立 的 线程 (或 进程 ) ， 这 样 任何 一 个 连接 的 阻塞 都 不 会 影响 其 他 的 连接 。 具 体 使 用 多 进 
程 还 是 多 线程 ， 并 没有 一 个 特定 的 模式 。 传 统 意义 上 ， 进 程 的 开销 要 远 远大 于 线程 ， 所 以 如 果 需 要 同时 为 较 多 的 客户 端 提供 服务 ， 则 不 推荐 使 用 多 进程 ; 如 果 单个 服务 执行 体 需要 消耗 较 多 的 CPU 资源 ， 例 
如 需要 进行 大 规模 或 长 时 间 的 数据 运算 或 文件 访问 ， 则 推荐 使 用 较为 安全 的 进程 。 通 常 ， 使 用 pthread_create () 创建 新 线程 ， 使 用 fork () 创建 新 进程 。 (多 线程 和 多 进程 将 在 后 续 章 节 详 细 学 习 。) 




























































































假设 对 前 面 第 6 章 举例 中 的 服务 器 客户 端 模型 提出 更 高 的 要 求 ， 即 让 服务 器 同时 为 多 个 客户 端 提供 一 问 一 答 的 服务 。 主 线程 持续 等 待 客户 端的 连接 请 求 ， 如 果 有 连接 ， 则 创建 新 线程 ， 并 在 新 线程 中 提供 
与 前 例 相同 的 问答 服务 。 




















很 多 读者 可 能 不 明白 为 何 一 个 socket 可 以 accept 多 次 。 实 际 上 socket 的 设计 者 可 能 特意 为 多 客户 端的 情况 留 下 了 伏笔 ， 让 accept () 能 够 返回 一 个 新 的 socket。 下 面 是 accept 接 口 的 原型 : 

















int accept(int fd, struct sockaddr *addr, socklen t *addrlen); 














输入 参数 fd 是 从 socket () . bind () ülisten () 中 沿用 下 来 的 socket 句 柄 值 。 执 行 完 bind () 和 listen () 后 ,操作 系统 已 经 开始 在 指定 的 端口 处 监听 所 有 的 连接 请 求 ， 如 果 有 请 求 ， 则 将 该 连接 请 
求 加 入 请 求 队列 。 调 用 accept () 接口 正 是 从 socket fd 的 请 求 队列 抽取 第 一 个 连接 信息 ， 创 建 一 个 与 fd 同类 的 新 的 socket 返 回 句柄 ， 这 个 新 的 socket 句 柄 即 是 后 续 read () 和 recv () 的 输入 参数 。 如 果 
请 求 队列 当前 没有 请 求 ， 则 accept () 将 进入 阻塞 状态 直到 有 请 求 进入 队列 。 









































上 述 多 线程 的 服务 器 模型 似乎 完美 地 解决 了 为 多 个 客户 机 提供 问答 服务 的 要 求 ， 但 其 实 并 不 尽 然 。 如 果 要 同时 响应 成 百 上 干 路 的 连接 请 求 ， 则 无 论 多 线程 还 是 多 进程 都 会 严重 占据 系统 资源 ， 降 低 系 统 
对 外 界 响 应 的 效率 ， 而 线程 与 进程 本 身 也 更 容易 进入 假死 状态 。 




















很 多 程序 员 可 能 会 考虑 使 用 “线程 池 ” 或 “连接 池 ”。 “线程 池 ” 旨 在 降低 创建 和 销毁 线程 的 频率 ， 使 其 维持 一 定 合理 数量 的 线程 ， 并 让 空闲 的 线程 重新 承担 新 的 执行 任务 。 “连接 池 ” 是 指 维持 连接 
的 缓存 池 ， 尽 量 重用 已 有 的 连接 ， 降 低 创 建 和 关闭 连接 的 频率 。 这 两 种 技术 都 可 以 很 好 地 降低 系统 开销 ， 都 被 广泛 应 用 于 很 多 大 型 系统 。 但 是 ，“ 线 程 池 ” 和 “连接 池 ” 技 术 也 只 是 在 一 定 程度 上 缓解 了 频 
繁 调用 IO 接口 带 来 的 资源 占用 。 而 且 ， 所 谓 “ 池 ”始终 有 其 上 限 ， 当 请 求 大 大 超过 上 限时 ，“ 池 ”构成 的 系统 对 外 界 的 响应 并 不 比 没有 “ 池 ” 的 时 候 效 果 好 多 少 。 所 以 使 用 “ 池 ” 必须 考虑 其 面临 的 响应 规 
模 ， 并 根据 响应 规模 调整 “ 池 ” 的 大 小 。 








































































































现实 生活 所 面临 的 可 能 是 同时 出 现 的 上 干 甚至 上 万 次 的 客户 端 请 求 ，“ 线 程 池 ”或 “连接 池 ” 或 许可 以 缓解 部 分 压力 ， 但 是 不 能 解决 所 有 问题 。 总 之 ， 多 线程 模型 可 以 方便 高 效 的 解决 小 规模 的 服务 请 
求 ， 但 面 对 大 规模 的 服务 请 求 ， 多 线程 模型 也 会 遇 到 瓶颈 ， 可 以 用 非 阻塞 模型 来 尝试 解决 这 个 问题 。 




















2. 非 阻塞 1O 模 型 





在 Linux 下 ， 可 以 通过 设置 socket 使 IO 变 为 非 阻塞 状态 。 当 对 一 个 非 阻塞 的 socket 执 行 read 操 作 时， 流程 如 图 7-2 所 示 。 











没有 数据 报 准 备 好 


数据 报 准 备 好 了 
复制 数据 报 


复制 完成 


系统 内 核 
没有 数据 报 准 备 好 


| 系统 调用 
: recvfrom : : = > 
| ”返回 错误 | 
: ! ZA : 
i recvfrom i AIA j 
i : ”返回 错误 | 
进程 重复 调用 MENS | — unn | 
recvfrom， 直 到 : » | 
返回 ok 为 止 | recvfrom RH | 
”处 理 数据 报 EO 
PCI 二 一 

图 7-2 ” 非 阻塞 IO 模型 


从 图 7-2 可 以 看 出 ， 

















当 用 户 进程 发 出 read 操 作 时 ， 如 果 内 核 中 的 数据 还 没有 准备 好 ， 那 么 它 并 不 会 block 








户 进程 ， 而 是 立刻 返回 














一 个 错误 。 从 











待 ， 而 是 马上 就 得 到 了 一 个 结果 。 当 用 户 进程 判断 结果 是 一 个 错误 时 ， 它 就 知道 数据 还 没有 准备 好 ， 于 是 它 可 以 再 次 发 送 read 操 作 。 一 旦 内 核 中 的 数据 准备 好 了 ， 并 且 又 再 次 收 到 了 
那么 它 马 上 就 将 数据 复制 到 了 用 户 内 存 中 ， 然 后 返回 正确 的 返回 值 。 


状 7 














所 以 ， 在 非 阻塞 式 IO 中 ， 用 户 进 程 其 实 需 要 不 断 地 主动 询问 kerne 收 k 据 是 否 准 备 好 。 非 阻塞 的 接口 相 比 于 
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户 进程 角度 讲 ， 它 发 起 一 个 read 操 作 后 ， 并 不 需要 等 





用 户 进程 的 系统 调用 ， 








之 后 立即 返回 。 使 用 





如 下 的 函数 可 以 将 某 句柄 fd 设 为 非 








fcntl( fd, F SETFL, O NONBLOCK ); 





在 非 阻塞 状态 下 ，recv () 接 


(1) recv () 返回 值 大 于 0， 表 示 接 收 数据 完毕 ， 返 回 值 




















后 立即 返回 ， 





返 





回 


值 代表 了 不 同 的 含义 ， 如 下 所 述 。 




















是 接收 到 的 字 节 数 。 


(2) recv () 返回 0， 表 示 连 接 已 经 正常 断 开 。 


(3) recv () 返回 -1， 且 errno 等 于 FAGAIN ， 表 示 recv 操 作 还 没 执行 完成 。 








(4) recv () 返回 





可 以 看 到 服务 器 线程 可 以 通过 循环 调 
方案 中 recv () 更 多 的 是 起 到 检测 “操作 是 否 完成 ”的 作 








3. 多 路 IO 复 用 





模型 








-1， 且 errno 不 等 于 EAGAIN， 表 示 recv 操 作 遇 到 系统 错误 errno。 




















recv () 接 | 








， 可 以 在 单个 线程 内 实现 对 所 有 连接 的 数据 接收 工作 。 但 是 上 述 模型 绝 不 被 推荐 ， 























， 实 际 操作 系统 提供 了 更 为 高 效 的 检测 “操作 是 否 





uA" E 





的 接 
































， 例 如 select () 多 路 复 用 




















recv () 将 大 幅度 占用 CPU 使 
模式 ， 可 以 一 次 检测 多 个 连接 是 否 活跃 。 


多 路 IO 复 用 ， 有 时 也 称 为 事件 驱动 1O。 它 的 基本 原理 就 是 有 个 函数 (select) 会 不 断 地 轮 询 所 负责 的 所 有 socket， 当 某 个 socket 有 数据 到 达 了 ， 就 通知 用 户 进程 ， 多 路 IO 复 用 


























率 ; 此 外 ， 在 这 个 


模型 的 流程 如 图 7-3 所 





et . ”没有 数据 报 准备 好 
进程 阻塞 于 select | | | | 
调用 ， 等 待 有 可 | | 
(oir | i l | 
| : 返回 可 读 | | 
| recvfrom 系统 调用 数据 报 准备 好 了 | 
] — 复制 数据 报 。 
数据 复制 到 进程 | | | | 
EHE 进 i | | | 
| | ”返回 OK : | 





7-3 多 路 IO 复 用 模型 的 流程 











Ins] 




















当 用 户 进程 调用 了 select， 那 么 整个 进程 会 被 阻塞 ， 而 同时 ， 内 核 会 “监视 ”所 有 select 负 责 的 socket， 当 任何 一 个 socket 中 的 数据 准备 好 了 ，select 就 会 返回 。 这 个 时 候 用 户 进程 再 调用 read 操 作 ， 将 
数据 从 内 核 拷贝 到 用 户 进程 。 







































































这 个 模型 和 阻塞 1O 的 模型 其 实 并 没有 太 大 的 不 同 ， 事 实 上 还 更 差 一 些 。 因 为 这 里 需要 使 用 两 个 系统 调用 (select 和 recvfrom) ， 而 阻塞 1O 只 调用 了 一 个 系统 调用 (recvfrom) 。 但 是 ， 用 select 的 优势 
在 于 它 可 以 同时 处 理 多 个 连接 。 所 以 ， 如 果 处 理 的 连接 数 不 是 很 高 的 话 ， 使 用 select/epoll 的 Web server 不 一 定 比 使 用 多 线程 的 阻塞 |0 的 Web server 性 能 更 好 ， 可 能 延迟 还 更 大 ; select/epoll 的 优势 并 不 是 
对 于 单个 连接 能 处 理 得 更 快 ， 而 是 在 于 能 处 理 更 多 的 连接 。 























在 多 路 复 用 IO 模型 中 ， 对 于 每 一 个 socket， 一 般 都 设置 成 为 非 阻塞 的 ， 但 是 ， 如 图 7-3 所 示 ， 整 个 用 户 的 进程 其 实 是 一 直 被 阻塞 的 。 只 不 过 进程 是 被 select 这 个 函数 阻塞 ， 而 不 是 被 socket IOS., A 
此 使 用 select () 的 效果 与 非 阻塞 1O 类 似 。 

































































大 部 分 UNIX/Linux 都 支持 select 函 数 ， 该 函数 用 于 探测 多 个 文件 句柄 的 状态 变化 。 下 面 给 出 select 接 口 的 原型 : 





FD ZERO(int fd, fd set* fds) ; 

FD SET(int fd, fd set* fds) ; 

FD ISSET(int fd, fd set* fds) ; 

FD CLR(int fd, fd set* fds) ; 

int select (int nfds, fd set *readfds, fd set *writefds, fd set *exceptfds,struct timeval *timeout) ; 





























这 里 ，fd_set 类 型 可 以 简单 理解 为 按 bit 位 标记 句柄 的 队列 ， 例 如 要 在 某 fd_set 中 标记 一 个 值 为 16 的 句柄 ， 则 该 fd_set 的 第 16 个 bit 位 被 标记 为 1。 具 体 的 置 位 、 验 证 可 使 用 FD_SET、FD ISSETSSZA SEHR. 
在 select () 函数 中 ，readfds、writefds 和 exceptfds 同 时 作为 输入 参数 和 输出 参数 。 如 果 用 输入 的 readfds 标 记 了 16 号 句柄 ， 则 select () 将 检测 16 号 句柄 是 否 可 读 。 在 select () 返回 后 ， 可 以 通过 检查 
readfds 有 和 否 标 记 16 号 句柄 ， 来 判断 该 “可 读 事件 ”是 否 发 生 。 另 外 ， 用 户 可 以 自行 设置 timeout 时 间 。 



































客户 端的 一 个 connect () 操作 ， 将 在 服务 器 端 激 发 一 个 “可 读 事 件 ”， 所 以 select () 也 能 检测 来 自 客户 端的 connect () 行为 。 








使 用 select 函 数 时 ， 最 关键 的 地 方 是 如 何 动态 维护 select () 的 3 个 参数 readfds、writefds 和 exceptfds。 作 为 输入 参数 ，readfds 应 该 标记 所 有 的 需要 检测 的 “可 读 事件 ”的 句柄 ， 其 中 永远 包括 那个 检 
测 connect () 的 那个 “ 母 ”句柄 ; 同时 ，writefds 和 exceptfds 应 该 标记 所 有 需要 检测 的 “可 写 事 件 ” 和 “错误 事件 ”的 句柄 (使 用 FD_SET () 标记 ) 。 























作为 输出 参数 ，readfds、writefds 和 exceptfds 中 保存 了 select () 捕捉 到 的 所 有 事件 的 句柄 值 。 程 序 员 需要 检查 所 有 的 标记 位 (使 用 FD ISSET () 检查 ) ， 以 确定 到 底 哪些 句柄 发 生 了 事件 。 





如 果 select () 发 现 某 句 柄 捕捉 到 了 “可 读 事件 ”， 服 务 器 程序 应 及 时 做 recv () 操作 ， 并 根据 接收 到 的 数据 准备 好 待 发 送 数据 ， 并 将 对 应 的 句柄 值 加 入 writefds， 准 备 下 一 次 的 “可 写 事件 ”的 
select () 检测 。 同 样 ， 如 果 select () 发 现 某 句柄 捕捉 到 “可 写 事件 ”， 则 程序 应 及 时 做 send () 操作 ， 并 准备 好 下 一 次 的 “可 读 事件 ”检测 准备 。 图 7-4 描 述 了 多 路 IO 复 用 模型 中 的 一 个 执行 周期 。 




















select(nfds ,&readfds &writefds,&exceptfds,timeout) 





If event 1? - tu 






no 


Response to event 1 





loop 


If event2? UN 


Scd Response to event 2 





Scan other events 


Prepare readfds,writefds,exceptfds,timeout for the 


next select operation 





图 7-4 ”多 路 IO 复 用 模型 的 一 个 执行 周期 


这 种 模型 的 特征 在 于 每 一 个 执行 周期 都 会 探测 一 次 或 一 组 事件 ， 一 个 特定 的 事件 会 触发 某 个 特定 的 响应 ， 这 里 可 以 将 这 种 模型 归 类 为 “事件 驱动 模型 ”。 





相 比 其 他 模型 ， 使 用 select () 的 事件 驱动 模型 只 用 单线 程 进程) 执行 ， 占 用 资源 少 ， 不 消耗 太 多 CPU 资源 ， 同 时 能 够 为 多 客户 端 提供 服务 。 如 果 试图 建立 一 个 简单 的 事件 驱动 的 服务 器 程序 ， 这 个 
模型 有 一 定 的 参考 价值 。 








但 这 个 模型 依旧 有 着 很 多 问题 。 首 先 select () 接口 并 不 是 实现 “事件 驱动 ”的 最 好 选择 。 因 为 当 需 要 探测 的 句柄 值 较 大 时 ，select () 接口 本 身 需 要 消耗 大 量 时 间 去 轮 询 各 个 句柄 。 很 多 操作 系统 提供 
了 更 为 高 效 的 接口 ， 如 Linux 提 供 了 epoll，BSD 提 供 了 kKkqueue，Solaris 提 供 了 /dev/poll 等 。 如 果 需 要 实现 更 高 效 的 服务 器 程序 ， 则 更 推荐 使 用 类 似 epoll 这 样 的 接口 。 遗 憾 的 是 ， 不 同 的 操作 系统 特 供 的 
epoll 接 口 有 很 大 差异 ， 所 以 使 用 类 似 于 epoll 的 接口 实现 具有 较 好 跨 平 台 能 力 的 服务 器 会 比较 困难 。 











其 次 ， 该 模型 将 事件 探测 和 事件 响应 夹杂 在 一 起 ， 一 旦 事件 响应 的 执行 体 过 于 庞大 ， 则 对 整个 模型 是 灾难 性 的 。 如 图 7-5 所 示 ， 庞 大 的 执行 体 1 将 直接 导致 响应 事件 2 的 执行 体 迟 迟 得 不 到 执行 ， 并 在 很 
大 程度 上 降低 了 事件 检测 的 及 时 性 。 


select(nfds,&readfds,&writefds, &exceptfds,timeout) 


Response to event 1: 
Ü.receive data from remote 
l,calculation 1 
2,calculation 2 
3.calculation 3 


Scan other events 


Prepare readfds,writefds,exceptfds timeout for the 


next select operation 


图 7-5 复杂 的 事件 1 ， 导 致 事 件 2 迟 迟 未 执行 





幸运 的 是 ， 有 很 多 高 效 的 事件 驱动 库 可 以 屏蔽 上 述 难题 ， 常 见 的 事件 驱动 库 有 libevent 库 、libev 库 等 。 这 些 库 会 根据 操作 系统 的 特点 选择 最 合适 的 事件 探测 接口 ， 并 且 加 入 了 相应 的 技术 以 支持 异步 响 





应 ， 使 得 这 些 库 成 为 构建 事件 驱动 模型 的 不 二 选择 。 下 面 的 第 8 章 将 介绍 如 何 使 用 libev 库 蔡 换 select 或 epoll 接 口 ， 以 实现 高 效 稳定 的 服务 器 模型 。 


实际 上 ，Linux 内 核 从 2.6 版 本 开始 ， 也 引入 了 支持 异步 响应 的 IO 操作 ， 如 aio_read、aio_write， 就 是 异步 IO 接口。 





4 异步 10 模 型 


异步 10 模 型 的 流程 如 图 7-6 所 示 。 





用 户 进 程 发 起 read 操 作 之 后 ， 立 刻 就 可 以 开始 去 做 其 他 的 事 ; 而 另 一 方面 ， 从 内 核 的 角度 ， 当 它 收 到 一 个 异步 的 read 请 求 操作 之 后 ， 首 先 会 立刻 返回 ， 所 以 不 会 对 月 








有 户 进程 产生 任何 阻塞 。 然后， 内核 








会 等 待 数据 准备 完成 ， 然 后 将 数据 拷贝 到 用 户 内 存 中 ， 当 这 一 切 都 完成 之 后 ， 内 核 会 给 用 户 进程 发 送 一 个 信和 号， 返回 read 操 作 已 完成 的 信息 。 


进程 继续 执行 


调用 阻塞 IO 会 一 直 阻塞 住 对 应 的 进程 直到 操作 完成 ， 而 非 阻 塞 !O 在 内 核 还 在 准备 数据 的 情况 下 会 立刻 返回 。 














系统 调用 








图 7-6 “异步 IO 模型 流程 




















无 数据 报 准备 好 


aio read | 系统 调用 返回 | | 
PEEL CIUS E , | 
/ / | D | 
| 数据 报 准备 好 
| | | 拷贝 数据 报 

信号 触发 处 理 数据 报 4 is 拷贝 完成 | 


让 条 让 和 下 直下 | 


两 者 的 区 别 就 在 于 同步 IO 进行 IO 操作 时 会 阻塞 进程 。 按 照 这 个 定义 ， 之 前 所 述 的 阻塞 IO、 非 


阻塞 10 及 多 路 IO 复 用 都 属于 同步 IO。 实 际 上 ， 真 实 的 IO 操作 ， 就 是 例子 中 的 recvfrom 这 个 系统 调用 。 非 阻塞 !O 在 执行 recvfrom 这 个 系统 调用 的 时 候 ， 如 果 内 核 的 数据 没有 准备 好 ， 这 时 候 不 会 阻塞 进程 。 














但 是 当 内 核 中 数据 准备 好 时 ，recvfrom 会 将 数据 从 内 核 拷贝 到 用 户 内 存 中 ， 这 个 时 候 进 程 则 被 阻塞 。 而 异步 1O 则 不 一 样 ， 当 进程 发 起 IO 操作 之 后 ， 就 直接 返回 ， 




















成 ， 则 在 这 整个 过 程 中 ， 进 程 完 全 没有 被 阻塞 。 


各 个 IO 模型 的 比较 如 图 7-7 所 示 。 






































直到 内 核发 送 一 个 信和 号， 告诉 进程 |O 已 完 


异步 10 复 用 








图 7-7 各 种 IO 模 型 的 比较 





经 过 上 面 的 介绍 ,会 发 现 非 阻塞 |O 和 异步 10 的 区 别 还 是 很 明显 的 。 在 非 阻塞 |O 中 ， 虽 然 进程 大 部 分 时 间 都 不 会 被 阻塞 ， 但 是 它 仍然 要 求 进程 去 主动 检查 ， 并 且 当 数据 准备 完成 以 后 ， 也 需要 进程 主动 地 











再 次 调用 recvfrom 来 将 数据 拷贝 到 














状态 ， 也 不 需要 主动 地 拷贝 数据 。 


7.2 select 








户 内 存 中 。 而 异步 1O 则 完全 不 同 ， 它 就 像 是 




















户 进 程 将 整个 IO 操作 交 给 了 他 人 (PIER) 完成 ， 然 后 内 核 做 完 后 发 信号 通知 。 在 此 期 间 ，F 








户 进 程 不 需要 去 检查 10 操 作 的 





recvfrom 这 样 的 阻塞 程序 。 使 用 select 就 可 以 完成 非 阻塞 方式 工作 的 程序 ， 它 能 够 监视 需要 被 监视 的 文件 描述 符 的 变化 情况 
































本 节 将 介绍 前 面 多 路 IO 复 用 模型 中 讲 到 的 select 函 数 。select 函 数 在 socket 编 程 中 还 是 比较 重要 的 ， 可 是 很 多 初学 socket 的 人 可 能 并 不 爱 用 select 写 程序 ， 而 习惯 写 诸如 connect、accept、recv 或 


读 、 写 或 异常 。 


























1.select 函 数 原 型 








select 的 函数 原型 是 : 


int select (int maxfdp,fd set *readfds,fd set *writefds,fd set *errorfds,struct timeval*timeout); 








这 里 面 用 到 了 两 个 结构 体 : fd_set 和 timeval。 结 构 体 fd_set 可 以 理解 为 一 个 集合 ， 这 个 集合 中 存放 的 是 文件 描述 符 (file descriptor) ， 即 文件 句柄 ， 这 可 以 认为 是 常 说 的 普通 意义 的 文件 ; 当然 UNIX 





























下 任何 设备 、 管 道 、FIFO 等 都 是 文件 形式 ， 所 以 毫 无 疑问 ， 一 个 socket 就 是 一 个 文件 ，socket 句 柄 就 是 一 个 文件 描述 符 。fd_set 集 合 可 以 通过 一 些 宏 由 人 为 来 操作 ， 比 如 以 下 代码 : 


fd set set; 

FD ZERO(&set); /* 将 set 清 零 */ 

FD SET(fd, &set); /* 将 fd 加 入 set */ 

FD CLR(fd，&set); /* 将 fd 从 set 中 清除 */ 
FD ISSET(fd, &set); /* 如 果 fd 在 set 中 则 真 */ 


结构 体 timeval 是 一 个 常用 的 结构 ， 用 来 代表 时 间 值 ， 有 两 个 成 员 ， 一 个 是 秒 数 ， 另 一 个 是 毫秒 数 。 


接着 讲 下 select 的 各 个 参数 所 表示 的 含义 ， 如 下 所 述 。 





(1) maxfdp 是 一 个 整数 值 ， 是 指 集合 中 所 有 文件 描述 符 的 范围 ， 即 所 有 文件 描述 符 的 最 大 值 加 1。 

















(2) readfds 是 指向 fd_set 结 构 的 指针 ， 这 个 集合 中 应 该 包括 文件 描述 符 。 因 为 要 监视 文件 描述 符 的 读 变 化 的 ， 即 关心 是 否 可 以 从 这 些 文件 中 读 取 数据 ， 如 果 这 个 集合 中 有 一 个 文件 可 读 ，select 就 会 返 























回 一 个 大 于 0 的 值 ， 表 示 有 文件 可 读 。 如 果 没有 可 读 的 文件 ， 则 根据 timeout 参 数 再 判断 是 否 超时 : 若 超出 timeout 的 时 间 ，select 返 回 0; 若 发 生 错误 返回 负 值 ; 也 可 以 传 入 NULL 值 ， 表 示 不 关心 任何 文件 
的 读 变化 。 





返 


件 的 写 变 化 。 








(3) writefds 是 指向 fd_set 结 构 的 指针 ， 这 个 集合 中 应 该 包括 文件 描述 符 。 因 为 要 监视 文件 描述 符 的 写 变化 的 ， 即 关心 是 否 可 以 向 这 些 文件 中 写 入 数据 ， 如 果 这 个 集合 中 有 一 个 文件 可 写 ，select 就 会 
回 一 个 大 于 0 的 值 ， 表 示 有 文件 可 写 。 如 果 没有 可 写 的 文件 ， 则 根据 timeout 参 数 再 判断 是 否 超 时 : 若 超 出 timeout 的 时 间 ，select 返 回 0; 若 发 生 错误 返回 负 值 ; 也 可 以 传 入 NULL 值 ， 表 示 不 关心 任何 文 



































(4) errorfds 同 上 面 两 个 参数 的 意图 ， 用 来 监视 文件 错误 异常 。 

















(5) timeout 是 select 的 超时 时 间 ， 这 个 参数 至 关 重 要 ， 它 可 以 使 select 处 于 3 种 状态 : @ 若 将 NULL 以 形 参 传 入 ， 即 不 传 入 时 间 结 构 ， 就 是 将 select 置 于 阻塞 状态 ， 一 定 等 到 监视 文件 描述 符 集合 中 某 个 


文件 描述 符 发 生变 化 为 止 ， @ 若 将 时 间 值 设 为 0， 就 变 成 一 个 纯粹 的 非 阻塞 函数 ， 不 管 文件 描述 符 是否 有 变化 ， 都 立刻 返回 继续 执行 ， 文 件 无 变化 返回 0， 有 变化 返回 一 个 正 值 ; Btimeout 的 值 大 于 0， 这 就 
是 等 待 的 超时 时 间 ， 即 select 在 timeout 时 间 内 阻塞 ， 超 时 时 间 之 内 有 事件 到 来 就 返回 了 ， 和 否则 在 超时 后 不 管 怎样 一 定 返回 ， 返 回 值 同上 述 。 














(6) 返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 则 返回 0， 若 出 错 则 返回 -1。 




















2. 使 用 select 函 数 循环 读 取 键盘 输入 








【 例 7.1】 使 用 select 函 数 循环 读 取 键 盘 输入 。 

















keyboard.cpp 的 代码 是 : 


#include «sys/time.h» 
#include <stdio.h> 
#include <sys/types.h> 
#include <sys/stat.h> 
#include «fcntl.h» 
#include <assert.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <errno.h> 
#include <sys/select.h> 
int main (){ 
int keyboard; 
int ret,i; 
char c; 
fd_set readfd; 
struct timeval timeout; 
keyboard = open("/dev/tty",O RDONLY | O NONBLOCK); 
assert (keyboard?0); 
while (1)í( 
timeout.tv sec-1; 
timeout.tv usec-0; 
FD ZERO(&readfd); 
FD SET (keyboard, &readfd) ; 
ret-select (keyboard*1, &readfd, NULL, NULL, &timeout); 
if(FD ISSET (keyboard, &readfd)) ( 
i-read (keyboard, &c, 1); 
if ('\n'==c) 
continue; 
printf ("The input is $cWMn",c); 
if ('g'—c) 
break; 
} 
} 


return 0; 























g++-g-o keyboard keyboard.cpp 命 令 编译 得 到 keyboard 文 件 ， 执 行 ./keyboard 命 令 后 ， 只 要 发 现在 键盘 上 键入 字符 ， 程 序 就 输出 对 应 的 字符 。 执 行 结果 如 图 7-8 所 示 。 
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H7-8. 47.12 PUT AERA 
下 面 来 具体 看 下 程序 里 都 写 了 哪些 功能 。 
open("/dev/tty",O RDONLY | O NONBLOCK); 
/dev/tty 当 前 终端 ， 任 何 tty (任何 类 型 的 终端 设备 ) ，echo"hello">/dev/tty 都 会 直接 显示 在 当前 的 终端 中 。 
O_RDONLY 指 只 读 方式 ，O_NONBLOCK 指 非 阻 塞 方式 。 
综合 起 来 就 是 ， 非 阻塞 地 读 取 终 端 上 的 输入 信息 。 
assert (keyboard»0) ; 


assert 宏 的 原型 定义 在 <assert.h> 中 ， 其 作用 是 如 果 它 的 条 件 返回 错误 ， 则 终止 程序 执行 ， 原 型 定义 如 下 所 示 : 























assert 的 作用 是 计算 表达 式 expression ， 如 果 其 值 为 假 ( 即 为 0) ， 那 么 它 先 向 stderr 打 印 一 条 出 错 信息 ， 然 后 通过 调用 abort 来 终止 程序 运行 。 




















或 者 说 ， 打 开 终端 后 会 返回 一 个 文件 描述 符 ， 如 果 这 个 文件 描述 符 小 于 等 于 0， 就 表示 打开 失败 ， 失 败 就 得 退出 程序 。 











timeout.tv sec-1; 

timeout.tv usec-0; 

FD ZERO (&readfd) ; 

FD SET (keyboard, &readfd) ; 

ret-select (keyboard*l, &readfd, NULL, NULL, &timeout); 














超时 时 间 设 为 1s， 把 可 读 的 fd 集合 都 清空 ， 再 把 打开 终端 的 描述 符 加 入 到 可 读 描述 符 集合 中 ， 调 用 select 函 数 查看 是 否 有 可 读 的 fd。 














if(FD ISSET (keyboard, &readfd)) ( 
i-read (keyboard, &c, 1) ; 
if ('\n'==c) 
continue; 
printf ("The input is $cWn",c); 
if ('g'—c) 
break; 








如 果 终 端的 描述 符 在 可 读 描述 符 集合 中 ， 就 开始 读 取 数 据 ， 如 果 读 到 的 字符 是 \n， 即 换行 符 ， 则 继续 ;如 果 读 到 的 字符 是 q9， 就 退出 ;否则 就 输出 该 字符 。 








这 样 就 实现 了 循环 读 取 了 键盘 的 输入 。 但 是 ， 这 里 设置 的 超时 时 间 似 乎 没有 派 上 用 场 ， 这 是 由 于 没有 判断 select 的 返回 值 导致 的 。 例 7.2 即 把 select 的 返回 值 做 了 判断 ， 可 以 比较 来 看 。 











【 例 7.2】 ”观察 select 超 时 时 的 表现 。 


keyboard.cpp 的 代码 是 : 





#include <sys/time.h> 
#include <stdio.h> 
#include <sys/types.h> 
#include <sys/stat.h> 
#include «fcntl.h» 
#include <assert.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <errno.h> 
#include <sys/select.h> 
int main (){ 
int keyboard; 
int ret,i; 
char c; 
fd_set readfd; 
struct timeval timeout; 
keyboard = open("/dev/tty",O RDONLY | O NONBLOCK); 
assert (keyboard»0); T 7 
while(1) { 
timeout.tv_sec=5; 
timeout.tv usec-0; 
FD ZERO (&readfd); 
FD SET (keyboard, &readfd) ; 
ret-select (keyboard*l, &readfd, NULL, NULL, &timeout); 
if (ret — -1) 
perror("select error"); 
else if (ret)( 
if(FD ISSET (keyboard, &readfd) ) ( 
i-read (keyboard, &c,1); 
if ('\n'==c) 


continue; 
printf ("hehethe input is %c\n",c); 
if ('g'—c) 
break; 
l 
Jelse if (ret — 0) 


printf ("time outin"); 


return 0; 


























g* *-g-o keyboard keyboard.cpp 命 令 编译 得 到 keyboard 文 件 ， 执 行 ./keyboard 命 令 后 ， 只 要 发 现在 键盘 上 键入 字符 ， 程 序 就 输出 对 应 字符 。 不 过 ， 如 果 超 过 5s 不 输入 字符 ， 程 序 会 自动 打印 t 
time out。 执 行 结果 如 图 7-9 所 示 。 
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图 7-9” 例 7.2 程 序 执行 结果 图 


例 7.2 与 例 7.1 相 比 ， 下 面 的 代码 有 所 不 同 。 





if (ret == -1) 
perror("select error"); 
else if (ret)( 
if(FD ISSET (keyboard, &readfd)) ( 
i-read (keyboard, &c, 1) ; 
if ('\n'==c) 
continue; 
printf ("The input is $cWMn",c); 
if ('g'—c) 
break; 
} 
} 
else if (ret — 0) 
printf ("time outin"); 

















ret 值 是 select 函 数 的 返回 值 。 如 果 ret 的 值 为 -1， 即 代表 select 函 数 调 用 失败 ; 如 果 ret 的 值 为 0， 则 代表 等 待 时 间 超 时 ， 此 时 仍然 没有 可 读 或 可 写 的 描述 符 ， 则 程序 打印 出 time out， 提 示 已 超时 。 





回 





























使 用 select 函 数 提高 服务 器 的 处 理 能 








server.cpp 的 代码 如 下 : 


#include <sys/types.h> 

#include <sys/socket.h> 

#include <netinet/in.h> 

#include <arpa/inet.h> 

#include <unistd.h> 

#include <stdio.h> 

#include «stdlib.h» 

#include <strings.h> 

#include «sys/wait.h» 

#include <string.h> 

#include <errno.h> 

#define DEFAULT_PORT 6666 

int main( int argc, char ** argv) { 
int serverfd,acceptfd; /* 监听 socket: 
struct sockaddr in my addr; /* 本 机 地 址 
struct sockaddr in their addr; /* 客户 地 址 信息 */ 
unsigned int sin size, myport-6666, lisnum-10; 





erfd, 数据 传输 socket : acceptfd */ 
*/ 








if ((serverfd = socket(AF INET , SOCK STREAM, 0)) == -1) { 
perror("socket" ); 
return -1; 


} 

printf ("socket ok Mn"); 

my addr.sin family-AF INET; 

my addr.sin port-htons (DEFAULT PORT); 
my addr.sin addr.s addr = INADDR ANY; 
bzero(&(my addr.sin zero), 0); 


if (bind(serverfd, (struct sockaddr *)&my addr, sizeof(struct sockaddr )) == -1) { 
perror("bind" ); 
return -2; 


l 
printf ("bind ok Mn"); 


if (listen(serverfd, lisnum) == -1) ( 
perror("listen" ); 
return -3; 


} 
printf("listen ok Mn"); 
fd set client fdset; /* 监 控 文 件 描述 符 集 合 */ 
int maxsock; /* 监 控 文 件 描述 符 中 最 大 的 文件 号 */ 
struct timeval tv; /* 超 时 返回 时 间 */ 
int client sockfd[5];  ”/* 存 放 活 动 的 sockfd*/ 
bzero((void*)client sockfd, sizeof (client sockfd)); 
int conn amount = 07 /* 用 来 记录 描述 符 数量 */ 
maxsock = serverfd; 
char buffer[1024]; 
int ret-0; 
while(1)( 

/* 初 始 化 文件 描述 符号 到 集合 */ 

FD ZERO(&client fdset); 

/* 加 入 服务 器 描述 等 */ 
FD SET (serverfd, gclient fdset); 
/* 设 置 超时 时 间 */ 
tv.tv sec = 30; /*30 秒 */ 
tv.tv usec = 0; 
/* 把 活动 的 句柄 加 入 到 文件 描述 符 中 */ 
for(int i = 0; i < 5; ++i){ 

/* 程 序 中 Listen 中 参数 设 为 5, 故 i 必 须 小 于 5*/ 
if(client sockfd[i] != 0){ 
FD SET(client sockfd[i], &client fdset); 





} 
} 
/*printf("put sockfd in fdset!\n");*/ 


/*select 函 数 */ 
ret = select (maxsock+1, &client_fdset, NULL, NULL, &tv); 
if(ret < 0){ 

perror("select error! Wn"); 

break; 


} 

else if(ret == 0){ 
printf ("timeout!\n"); 
continue; 


} 
/* 轮 询 各 个 文件 描述 符 */ 
for(int i = 0; i < conn amount; ++i){ 
/*FD ISSETMkS client sockfd 是 否 可 读 写 ，>0 可 读 写 */ 
if (FD ISSET(client sockfd[i], &client fdset))( 
printf("start recv from client[$d]: n",i); 
ret = recv(client sockfd[i], buffer, 1024, 0); 
if (ret <= 0){ 
printf("client[$d] close\n", i); 
close(client sockfd[il); 
FD CLR(client sockfd[i], &client fdset); 
client sockfd[i] - 0; 
l 
else( 
printf("recv from client[$d] :$sWn", i, buffer); 
} 
} 


} 
/* 检 查 是 否 有 新 的 连接 ， 如 果 收 ， 接 收 连 接 ， 加 入 到 client sockfd 中 */ 
if (FD ISSET(serverfd, &client fdset)){ 
/* 接 受 连接 */ 
struct sockaddr in client addr; 
size t size = sizeof(struct sockaddr in); 
int sock client = accept(serverfd, (struct sockaddr*) (client addr), (unsigned int*) (&size)); 
if(sock client < 0){ 
perror("accept error! Wn"); 
continue; 
l 
/* 把 连接 加 入 到 文件 描述 符 集合 中 */ 
if (conn amount < 5)( 
client sockfd[conn amount-4] = sock client; 
bzero (buffer,1024); m 
strcpy (buffer, "this is server! welcome! Wn"); 
send(sock client, buffer, 1024, 0); 
printf ("new connection client[$d] $s:$dWn", conn amount, inet ntoa(client addr.sin addr), ntohs(client addr.sin port)); 
bzero (buffer, sizeof (buffer)); 
ret = recv(sock client, buffer, 1024, 0); 
if(ret < 0)( 一 
perror("recv error!\n"); 
close (serverfd); 
return -1; 


printf("recv : %s\n",buffer); 
if(sock client > maxsock)( 
maxsock = sock client; 


elset 
printf ("max connections! !!quit!!\n"); 
break; 
} 
} 
} 
$ 
for(int i= 0; i < 5; ++ij{ 
if(client sockfd[i] != 0){ 
close (client_sockfd[i]); 
} 
} 
close (serverfd); 
return 0; 


} 





client.cpp 的 代码 是 : 





#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <errno.h> 
#define DEFAULT_PORT 6666 
int main( int argc, char * argv[]){ 
int connfd = 0; 
int cLen - 0; 
struct sockaddr in client; 
if(argc < 2){ 
printf(" Uasge: clientent [server IP address] Wn"); 
return -1; 
l 
client.sin family - AF INET; 
client.sin port = htons (DEFAULT PORT); 
client.sin addr.s addr = inet addr(argv[1]); 
connfd = socket(AF INET, SOCK STREAM, 0); 
if(confd < 0){ ` T 
perror ("socket" ); 
return -1; 
i 
if (connect (connfd, (struct sockaddr*)&client, sizeof(client)) < O)( 
perror("connect" ); 


出 
时 


i 


return -1; 


l 
char buffer[1024]; 
bzero (buffer, sizeof (buffer)); 
recv(connfd, buffer, 1024, 0); 
printf("recv : %s\n", buffer); 
bzero (buffer, sizeof (buffer)); 
strcpy (buffer, "this is client!Wn"); 
send(connfd, buffer, 1024, 0); 
while (1) { 

bzero (buffer, sizeof (buffer) ); 

scanf ("%s",buffer); 

int p = strlen (buffer); 

buffer [p] *NOT; 

send(connfd, buffer, 1024, 0); 

printf("i have send bufferWn"); 


} 
close (connfd) ; 
return 0; 


makefile 的 代码 是 : 


all:server client 
server:server.o 

g++ -g -o server 
client:client.o 

gt+ -g -o client 
server.o:server.cpp 

g++ -g -c server. 
client.o:client.cpp 

gtt -g =c client. 
clean:all 

rm all 


server.o 
client.o 
cpp 


cpp 


执行 make 命 令 后 ， 生 成 server 和 client2 个 可 执行 文件 。 分 别 打开 3 个 终端 窗口 








， 第 一 个 执行 ./server 命 令 ， 第 二 个 














中 随意 输入 字符 串 ， 则 在 第 一 个 终端 窗 

















执行 ./client 127.0.0.1 命 令 ， 表 示 连 上 本 机 的 6666 端 口 
可 以 收 到 对 应 的 字符 串 。 然 后 在 第 三 个 终端 窗 


。 此 时 第 一 个 终端 窗口 里 输 
里 也 执行 ./client 127.0.0.1 命 令 ， 这 



































"new connection client[1]127.0.0.1: 36779”， 若 此 时 向 第 二 个 终端 窗 
， 第 一 个 终端 窗口 会 提示 “new connection client[2]127.0.0.1: 36780" , 
执行 结果 如 图 7-10 所 示 。 
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下 面 来 具体 分 析 程 序 各 部 分 内 容 。 





同样 的 向 第 三 个 终端 窗 


[sharexuglinux 9 

[sharexuglinux 976 
[sharexuglinu 
[sharexuGLinux 9703] 
this 
send 
nd 


i have send 


1 have send 





输入 字符 串 ， 第 一 个 终端 窗 











中 也 可 以 看 见 。 
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server 
server 
server 
server 
server 


a 

found 

cd 
charpter07]$ cd 07 
$ ./client 127.0.0 
is server! welcone! 


command n 


93 
v3 


buffer 
buffer 
buffer 


buffer 


[sharexuglinux 9763 











37-10 ” 例 7.3 程 序 执行 结果 图 








$ 


[sharexuglinux ~] 
[sharexuglinux 070 


cd charpter67/ 


is:hello 
g is:hello 
is:hello 
is:hello 
is:hello 
is:hello 


Mono D 


D D 


ux ]$ ./client 1 
is server! welcome! 
buffer 
buffer 
bufter 
buffer 


harexuglinux 07 


s 


server.cpp 中 ， 获 得 监听 描述 符 后 ， 就 开始 了 一 个 while 循 环 。 在 这 个 while 循 环 中 ， 需 要 不 断 地 查看 是 否 有 新 client 连 接 ; 已 连 上 的 client 是 否 有 发 送 消息 过 来 。 先 初始 化 文件 描述 符 集合 ， 把 服务 器 描 


符 加 入 到 集合 中 ， 设 置 select 的 超时 时 间 ， 代 码 如 下 所 示 。 





/* 初 始 化 文件 描述 符号 到 集合 */ 

FD ZERO(&client fdset); 

/* 加 入 服务 器 描述 符 */ 

FD SET (serverfd,&client fdset); 
/* 设 置 超时 时 间 */ 

tv.tv sec = 30; /*30 秒 */ 

tv.tv usec = 0; 





把 已 连 上 的 client 的 fd 也 加 入 到 和 集合 中 ， 方便 检查 是 否 有 数据 可 读 ， 代 码 如 下 : 


/* 把 活动 的 句柄 加 入 到 文件 描述 符 中 */ 
for(int i = 0; i < 5; ++i){V* 程 序 中 Listen 中 参数 设 为 5, 故 i 必 须 小 于 5*/ 
if(client sockfd[i] != O)( 
FD SET(client sockfd[i], &client fdset); 
l 

















调用 select 函 数 ， 注 意 要 根据 起 返回 值 判断 程序 是 否 有 异常 ， 代 码 如 下 : 
ret = select (maxsock+1, &client fdset, NULL, NULL, &tv); 


if(ret < 0){ 
perror("select error!\n"); 
break; 

} 

else if(ret == 0){ 
printf ("timeout! Wn"); 
continue; 





先 看 已 连 上 的 client 的 fd 有 无 可 读 的 数据 ， 也 就 是 有 无 数据 可 接收 的 ， 有 就 输出 ， 没 有 或 异常 时 ， 要 将 相应 的 client 关 闭 连接 ， 并 将 它 在 集合 里 清 掉 ， 以 关闭 这 个 fd， 代 码 如 下 : 


for(int i = 0; i < conn amount; ++i){ 
/*FD_ISSET 检 查 client sockfd 是 否 可 读 写 ，>0 可 读 写 */ 
if (FD ISSET(client sockfd[i], &client fdset))( 
printf ("start recv from client[$d]: n",i); 
ret = recv(client sockfd[i], buffer, 1024, 0); 
if(ret <= O)( 
printf("client[$d] close\n", i); 
close(client sockfd[i]); 
FD CLR(client sockfd[i], &client fdset); 
client sockfd[i] - 0; 
} 
else{ 
printf("recv from client[$d] :%s\n", i, buffer); 


} 














俭 查 是 否 有 新 的 连接 ， 如 果 有 ， 建 立 接收 连接 ， 加 入 到 client_sockfd 中 ， 发 送 一 个 消息 给 client， 方 便 看 到 client 已 经 连 上 了 。 并 且 ， 还 需要 把 maxsock 更 新 ， 因 为 下 一 次 进入 while 循 环 调用 select 时 ， 
需要 传 当前 最 大 的 fd 值 + 1 给 select 函 数 。 相 关 代码 如 下 所 示 。 














if (FD_ISSET (serverfd，&client_fdset) ){ 
/* 接 受 连接 */ 
struct sockaddr in client addr; 
size t size = sizeof(struct sockaddr in); 
int sock client = accept (serverfd, (struct sockaddr*) (&client addr), (unsigned int*) (&size)); 
if(sock client < O)( 
perror ("accept error!NMn"); 
continue; 
l 
/* 把 连接 加 入 到 文件 描述 符 集合 中 */ 
if(conn amount < 5)( 
client sockfd[conn amount++] = sock client; 
bzero(buffer,1024); 
strcpy (buffer, "this is server! welcome! Wn"); 
send(sock client, buffer, 1024, 0); 
printf ("new connection client[$d] $s:$dWn", conn amount, inet ntoa(client addr.sin addr), ntohs(client addr.sin port)); 
bzero (buffer, sizeof (buffer)); 
ret = recv(sock client, buffer, 1024, 0); 
if(ret < 0)( ` 
perror("recv error!\n"); 
close (serverfd); 
return -1; 
l 
printf("recv : $sWn",buffer); 
if(sock client > maxsock)( 
maxsock = sock client; 
} 
else{ 
printf ("max connections!!!quit!!\n"); 
break; 








最 后 ， 把 已 连 上 的 client 的 fd 和 server 自 身 的 fd 都 关闭 ， 代 码 如 下 : 

















for(inti = Dr i< 5; ++i){ 
if(client sockfd[i] != 0){ 
close(client sockfd[i]); 
} 
} 


close (serverfd); 


如 此 ，server 就 能 同时 处 理 多 个 client 的 请 求 ， 达 到 提供 处 理 能 力 的 效果 。 








而 client.cpp 中 ， 也 是 连 上 server 后 开始 发 数据 ， 但 这 部 分 比较 简单 ， 读 者 可 自行 研究 。 











7.3 poll 


1.poll 函 数 原 型 
和 Select 函数 一 样 ，poll 函 数 也 可 以 用 于 执行 多 路 复 用 IO。 


poll 所 需要 的 头 文件 和 函数 原型 如 下 所 示 : 


#include<poll.h> 
int poll (struct pollfd * fds,unsigned int nfds,int timeout); 





pollfd 结 构 体 定义 如 下 所 示 : 


struct pollfd { 
int fd; /* 文件 描述 符 */ 
short events; /* 等 待 的 事件 */ 
short revents; /* 实际 发 生 了 的 事件 */ 





























每 一 个 pollfd 结 构 体 指定 了 一 个 被 监视 的 文件 描述 符 ， 可 以 传递 多 个 结构 体 ， 指 示 poll () 监视 多 个 文件 描述 符 。 每 个 结构 体 的 events 域 是 监视 该 文件 描述 符 的 事件 掩 码 ， 由 用 户 来 设置 这 个 域 的 属性 。 
revents 域 是 文件 描述 符 的 操作 结果 事件 掩 码 ， 内 核 在 调用 返回 时 设置 这 个 域 ， 并 且 events 域 中 请 求 的 任何 事件 都 可 能 在 revents 域 中 返回 。 具 体 的 事件 代码 和 代表 的 含义 如 表 7-1 所 示 。 

















回 























表 7-1 poll 事 件 














事件 分 类 事件 代码 意义 
POLLIN 有 数据 可 读 
POLLRDNORM 普通 数据 可 读 
POLLRDBAND 有 优先 数据 可 读 
POLLPRI 有 紧迫 数据 可 读 

ARM POLLOUT 写 数 据 不 会 导致 阻塞 
POLLWRNORM 写 普 通 数 据 不 会 导致 阻塞 
POLLWRBAND 写 优先 数据 不 会 导致 阻塞 
POLLMSGSIGPOLL 消息 可 用 
POLLER 指定 的 文件 描述 符 发 生 错 误 

非法 事件 POLLHUP 指定 的 文件 描述 符 挂 起 事件 
POLLNVAL 指定 的 文件 描述 符 非法 


实 














使 





示 上 这 些 事件 在 events 域 中 无 意义 ， 因 





为 它们 总 会 在 合适 的 时 候 从 revents 中 返回 。 





poll () 和 select () 不 一 样 ， 不 需要 显 式 地 请 求 异常 情况 报告 。 





POLLIN|POLLPRI 等 价 于 select () 的 读 事件 ，POLLOUTIPOLLWRBAND 等 价 于 select () 的 写 事件 ，POLLIN 等 价 于 POLLRDNORM|POLLRDBAND， 而 POLLOUT 则 等 价 于 POLLWRNORM。 例 如 ， 
要 同时 监视 一 个 文件 描述 符 是 否 可 读 或 可 写 ， 可 以 设置 events 为 POLLIN|POLLOUT。 在 poll 返 回 时 ， 只 要 检查 revents 中 的 标志 ， 获 得 对 应 于 文件 描述 符 请 求 的 events 结 构 体 。 如 果 POLLIN 事 件 被 设置 ， 则 





文件 描述 符 可 以 被 读 取 而 不 阻塞 ; 如 果 POLLOUT 被 设 





EA 


timeout 参 数 指定 等 待 的 毫秒 数 ， 无 论 1O 是 否 准备 好 ，poll 都 会 返回 。 























， 则 文件 描述 符 





F 可 以 写 入 而 不 导致 阻塞 。 这 些 标志 并 不 是 互 斥 的 : 它们 可 能 被 同时 设 

















备 好 IO 的 文件 描述 符 ， 但 并 不 等 待 其 他 的 对 


成 功 时 ，poll () 返回 结构 体 中 revents 域 不 为 0 的 文件 描述 符 个 数 : 如 果 在 超时 前 没有 任何 寺 











(1) EBADF: 一 个 或 多 个 结构 体 中 指定 的 文件 描述 符 无 效 。 


EINTR: 请 求 的 对 


EFAULTfds: 指针 指向 的 地 址 超出 进程 的 地 址 空间 。 





件 之 前 产生 一 个 信号 ， 调 用 可 以 本 





EINVALnfds: 参数 超出 PLIMIT_NOFILE 值 。 





ENOMEM : 可 用 内 存 不 足 ， 无 法 完成 请 求 。 


2. 使 用 poll 函 数 提高 服务 器 处 理 能 力 














【 例 7.4】 使 














server.cpp 的 代码 是 : 


#include 
#include <sys/socket 
#include <netinet/in 
#include 
#include <unistd.h> 
#include <stdio.h> 

#include <stdlib.h> 
#include <strings.h> 





poll 函 数 提高 服务 器 处 理 能 力 。 


«sys/types.h» 


.h» 
.h» 


«arpa/inet.h» 


finclude «sys/wait.h» 


finclude <string.h> 
finclude «errno.h» 
finclude «poll.h» 


#define IPADDRESS "127.0.0.1" 
#define PORT 6666 
#define MAXLINE 1024 
#define LISTENQ 5 

#define OPEN MAX 1000 
$define INFTIM -1 


/* 创 建 套 接 字 , 进行 绑 定 和 监听 */ 
int bind and listen (){ 


int serverfd; /* 


监听 socket: serverfd*/ 


struct sockaddr in my addr; /* 本 机 地 址 信息 */ 

unsigned int sin size; 

if ((serverfd = socket(AF INET , SOCK STREAM, 0)) == -1) { 
perror("socket" ); ` x 


return -1; 


} 


printf ("socket ok \n"); 
my addr.sin family-AF INET; 


my addr.sin addr 


.Sin port-htons (PORT); 


.S addr = INADDR ANY; 


bzero(& (my addr.sin zero), 0); 
if (bind(serverfd, (struct sockaddr *)&my addr, sizeof(struct sockaddr )) — -1) ( 
perror("bind" ); 


return -2; 


} 
printf ("bind ok Mn"); 


if 


(listen (serverfd, 


LISTENQ) = -1) { 


perror("listen" ); 


return -3; 


} 
printf ("listen ok \n"); 


return serverfd; 


} 
/*IO 多 路 复 用 poll*/ 


void do poll(int listenfd) { 
int connfd,sockfd; 
struct sockaddr in cliaddr; 


新 发 起 。 


timeout 指 定 为 负数 值 时 表示 无 限 超时 ， 使 poll () 一 直 挂 起 直到 一 个 指定 事件 发 生 ; timeout 为 0 指示 poll 调 
件 。 这 种 情况 下 ，poll () 的 返回 值 ， 一 旦 被 选举 出 来 ， 立 即 返 回 。 





有 件 发 生 ，poll () 返回 





， 表 示 这 个 文件 描述 符 的 读 取 和 写 入 操作 都 会 正常 返回 而 不 阻 

















立即 返回 并 列 出 准 














0。 失 败 时 ，poll () 返回 -1， 并 设置 errno 为 下 列 值 之 一 。 





socklen t cliaddrlen; 

struct pollfd clientfds [OPEN MAX]; 

int maxi; ul 

int i; 

int nready; 

/* 添 加 监听 描述 符 */ 

clientfds[0].fd = listenfd; 

clientfds[0].events - POLLIN; 

/* 初 始 化 客户 连接 描述 符 */ 

for (i = 1;i < OPEN MAX;i++) 
clientfds[i].fd = -1; 


maxi = 0; 
/* 循 环 处 理 */ 
while(1){ 
/* 获 取 可 用 描述 符 的 个 数 */ 
nready = poll(clientfds,maxi-*1l, INFTIM); 
if (nready == -1)( 
perror("poll error:"); 
exit(1); 


l 

/* 测 试 监听 描述 符 是 否 准 备 好 */ 

if (clientfds[0].revents & POLLIN) { 
cliaddrlen = sizeof (cliaddr); 


/* 接 受 新 的 连接 */ 
if ((connfd = accept (listenfd, (struct sockaddr*)&cliaddr,&cliaddrlen)) == -1)( 
if (errno == EINTR) 
continue; 
else{ 
perror ("accept error:"); 
exit (1); 


} 
} 
fprintf (stdout, "accept a new client: %s:%d\n", inet ntoa(cliaddr.sin addr), cliaddr.sin port ); 
/* 将 新 的 连接 描述 符 添加 到 数组 中 */ 
for (i = 1;i < OPEN MAX;i++){ 

if (clientfds[i].fd < O)í 
clientfds[i].fd = connfd; 
break; 

} 


l 
if (i — OPEN MAX)( 
fprintf (stderr, "too many clients. Wn"); 
exit(1); 


} 

/* 将 新 的 描述 符 添加 到 读 描 述 符 集合 中 */ 
clientfds[i].events = POLLIN; 

/* 记 录 客 户 连接 套 接 字 的 个 数 */ 


maxi = (i » maxi ? i : maxi); 
if (--nready «- 0) 
continue; 


l 
/* 处 理 多 个 连接 上 客户 端 发 来 的 包 */ 
char buf [MAXLINE]; 
memset (buf, 0, MAXLINE) ; 
int readlen-0; 
for (i = 1;i <= maxi;i++){ 
if (clientfds[i].fd « 0) 
continue; 
/* 测 试 客户 描述 符 是 否 准备 好 */ 
if (clientfds[i].revents & POLLIN)( 
/* 接 收容 户 端 发 送 的 信息 */ 
readlen = read(clientfds[i].fd,buf,MAXLINE); 
if (readlen == 0){ 
close (clientfds [i] . fd); 
clientfds[i].fd = -1; 


continue; 
l 
/*printf("read msg is: ");*/ 
write (STDOUT FILENO, buf, readlen); 
/* 向 客户 端 发 送 buf*/ 


write (clientfds[i].fd,buf,readlen); 
i 
} 
} 


int main(int argc,char *argv[])t 
int listenfd-bind and listen(); 
if (listenfd<0){ 7 
return 0; 
l 
do poll(istenfd); 
return 0; 





client.cpp 的 代码 是 : 





#include <sys/types.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <unistd.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <strings.h> 
#include <sys/wait.h> 
#include <string.h> 
#include <errno.h> 
#include <poll.h> 
#define MAXLINE 1024 
#define DEFAULT PORT 6666 
#define max(a,b) (a >b) ?a:b 
static void handle_connection (int sockfd); 
int main(int argc,char *argv[])( 
int connfd - 0; 
int cLen - 0; 
struct sockaddr in client; 
if(argc < 2){ 
printf(" Uasge: clientent [server IP address] \n"); 
return -1; 


client.sin family = AF INET; 
client.sin port = htons (DEFAULT PORT); 
client.sin addr.s addr = inet addr(argv[11]); 
connfd = socket(AF INET, SOCK STREAM, 0); 
if(connfd < 0){ 一 7 
perror("socket" ); 
return -1; 
} 
if(connect(connfd, (struct sockaddr*)&client, sizeof(client)) < 0){ 
perror("connect" ); 
return -1; 


l 
/* 处 理 连接 描述 符 */ 
handle connection (connfQ); 
return 0; 
} 
static void handle connection (int sockfd)( 
char sendline [MAXLINE], recvline [MAXLINE]; 
int maxfdp, stdineof; 
struct pollfd pfds[2]; 
int n; 
/* 添 加 连接 描述 符 */ 
pfds[0] .fd = sockfd; 
pfds[0] .events = POLLIN; 
/* 添 加 标准 输入 描述 符 */ 
pfds[1] .fd = STDIN FILENO; 


pfds [1] .events = POLLIN; 
while (1) { 
poll(pfds,2,-1); 
if (pfds[0].revents & POLLIN)( 
n = read (sockfd, recvline,MAXLINE); 
if (n = 0){ 
fprintf (stderr, "client: server is closed. Wn"); 
close (Sockfd) ; 
} 
write (STDOUT_FILENO, recvline,n); 





入 是 好 
if (pfds [1] .revents & POLLIN) ( 
n = read(STDIN FILENO, sendline,MAXLINE); 
if (n 一 1 
shutdown (sockfd, SHUT WR) ; 
continue; 


write (sockfd,sendline,n); 


makefile 的 代码 是 : 


all:server client 
Sserver:server.o 

g++ -g -o server server.o 
client:client.o 

g++ -g -o client client.o 
server.o:server.cpp 

g++ -g -c server.cpp 
client.o:client.cpp 

g++ -g -c client.cpp 
clean:all 

rm all 





D 
a 
hs 
ES 
IR] 


7-13 所 示 。 














程序 执行 结果 如 图 7-11、 











ind ok 
listen ok 
accept a new client: 








图 7-11 ” 例 7.4 服 务 器 端 执 行 结果 图 











[sharexuglinux 0794]$ ./client 127.0.0.1 
Jaaa 
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E72 ” 例 7.4 客 户 端 1 执行 结果 图 


sharexuglinux O704]$ ./client 127.0.0.1 
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E73 ” 例 7.4 客 户 端 2 执行 结果 图 
例 7.4 中 ， 编 写 了 一 个 echo server 程 序 ， 功 能 是 客户 端 向 服务 器 发 送 消息 ， 服 务 器 接收 输出 并 原样 返回 客户 端 ， 客 户 端 接收 到 消息 后 输出 到 终端 。 


server.cpp 中 ， 把 套 接 字 的 创建 、 绑 定 和 监听 ， 都 写 在 了 一 个 函数 中 ， 方 便 阅 读 。 


)&my addr, sizeof (struct sockaddr )) == -1) ( 


} 
} 
printf ("bind ok Mn"); 





if (listen(serverfd, LISTENQ) == -1) ( 
perror("listen" ); 
return -3; 


l 
printf ("listen ok Mn"); 
return serverfd; 




















先 把 服务 器 的 描述 符 加 入 到 描述 符 集合 中 ， 需 要 注意 的 是 ，select 所 用 的 描述 符 集合 是 一 个 fd_set 的 结构 体 中 ， 而 poll 的 描述 符 却 是 在 一 个 以 pollfd 为 元 素 的 数组 中 代码 如 下 : 





/* 添 加 监听 描述 符 */ 
clientfds[0].fd = listenfd; 
clientfds[0].events = POLLIN; 




















接 下 来 将 数组 初始 化 ， 注 意 别 把 第 一 个 元 素 给 覆盖 了 ， 因 为 第 一 个 已 添加 了 服务 器 描述 符 。 所 以 ， 且 从 1 开始 ， 而 不 是 从 0 开始 ， 代 码 如 下 : 








/* 初 始 化 客户 连接 描述 符 */ 
for (i = 1;i < OPEN MAX;i++) 
clientfds[i].fd = -1; 



































接着 是 一 个 while 循 环 ， 查 看 是 否 有 新 客户 端 连 接 ， 或 者 老 客户 端 是 否 有 数据 发 送 过 来 。 这 里 的 超时 时 间 设 为 -1， 表 示 无 限 超时 ， 使 poll () 一 直 挂 起 直到 一 个 指定 事件 发 生 。 而 maxi 就 是 clientfds 数 组 
中 最 大 的 下 标 。 有 新 client 接 入 时 ， 判 断 是 否 放 在 了 比较 大 的 下 标 位 置 ， 是 的 话 要 修改 maxi 的 值 ， 如 果 放 在 了 已 经 断 掉 连 接 的 下 标 位 置 ， 则 不 用 更 新 ， 代 码 如 下 : 









































nready = poll(clientfds,maxi*1, INFTIM); 


if (nready == -1){ 
perror("poll error:"); 
exit(1); 





当 有 新 的 客户 端 连 接 时 ， 必 须 接 受 ， 获 得 新 的 fd， 并 将 新 fd 放 到 数组 中 ， 代 码 如 下 : 





if (clientfds[0].revents & POLLIN)( 
cliaddrlen = sizeof (cliaddr); 
/* 接 受 新 的 连接 */ 
if ((connfd = accept (listenfd, (struct sockaddr*)&cliaddr, &cliaddrlen)) == -1)( 
if (errno == EINTR) 
continue; 
else{ 
perror ("accept error:"); 
exit (1); 
} 
} 
fprintf (stdout, "accept a new client: %s:%d\n", inet ntoa(cliaddr.sin addr),cliaddr.sin port); 
/* 将 新 的 连接 描述 符 添加 到 数组 中 */ 
for (i = 1;i < OPEN MAX;i-t)( 
if (clientfds[i].fd < O)( 
clientfds[i].fd = connfd; 
break; 
} 
} 
if (i == OPEN MAX)( 
fprintf (stderr, "too many clients. Mn"); 
exit(1); 


l 
/* 将 新 的 描述 符 添加 到 读 描 述 符 集合 中 */ 
clientfds[i].events = POLLIN; 


/* 记 录 客 户 连接 套 接 字 的 个 数 */ 
maxi — (i » maxi ? i : maxi); 
if (--nready «- 0) 

continue; 





还 需要 处 理 已 连接 上 来 的 客户 端 有 可 能 发 来 的 包 ， 代 码 如 下 : 





char buf [MAXLINE]; 
memset (buf, 0, MAXLINE) ; 
int readlen-0; 
for (i = 1;i <= maxi;i++){ 
if (clientfds[i].fd < 0) 
continue; 
/* 测 试 客户 描述 符 是 否 准备 好 */ 
if (clientfds[i].revents & POLLIN)( 
/* 接 收 客户 端 发 送 的 信息 */ 
readlen = read(clientfds[i].fd,buf,MAXLINE); 
if (readlen == 0){ 
close (clientfds[i].fd); 
clientfds[i].fd = -1; 


continue; 

l 

/*printf ("read msg is: ");*/ 
write (STDOUT FILENO, buf, readlen); 
/* 向 客户 端 发 送 buf*/ 


write (clientfds[i].fd,buf,readlen); 











例 7.4 的 client.cpp 值 得 仔细 看 一 下 ， 笔 者 也 用 了 poll 函 数 进 行 读 写 操作 。 判 断 是 否 有 数据 可 读 ， 需 要 检查 两 个 来 源 : @@ 服 务 器 是 否 发 来 了 包 ; @ 标 准 输入 中 是 否 有 输入 。 代 码 如 下 所 示 。 

















struct pollfd pfds[2]; 
int n; 
/* 添 加 连接 描述 符 */ 
pfds[0] .fd = sockfd; 
pfds[0] .events = POLLIN; 
/* 添 加 标准 输入 描述 符 */ 
pfds[1].fd = STDIN FILENO; 
pfds[1].events = POLLIN; 
while (1)( 
poll(pfds,2,-1); 
if (pfds[0].revents & POLLIN) ( 
n = read(sockfd, recvline,MAXLINE); 
if (n = 0) ( 
fprintf (stderr, "client: server is closed. Mn"); 
close (sockfd) ; 


} 
write(STDOUT FILENO, recvline,n); 


} 
/* 测 试 标准 输入 是 否 准备 好 */ 
if (pfds[1].revents & POLLIN)( 
n = read(STDIN FILENO, sendline, MAXLINE); 
if n = 0) {7 
shutdown (sockfd, SHUT_WR) ; 
continue; 
} 


write (sockfd, sendline,n); 




















综 上 所 述 ，poll 函 数 也 可 让 服务 器 具备 同时 处 理 多 个 客户 端 请 求 的 能 力 。 


7.4 epoll 


epoll 是 在 Linux 2.6 内 核 中 提出 的 ， 是 之 前 select 和 poll 的 增强 版 本 。 相 对 于 select 和 poll 来 说 ，epoll 更 加 灵活 ， 没 有 描述 符 限 制 。epoll 使 

















的 事件 存放 到 内 核 的 一 个 导 








件 表 中 ， 这 样 在 用 户 空间 和 内 核 空间 之 间 的 数据 拷贝 只 需 一 次 。 











1.epoll 接 口 








使 用 epoll 必 须 包含 下 面 的 这 个 头 文件 : 
































一 个 文件 描述 符 管理 多 个 描述 符 ， 将 用 户 关系 的 文件 描述 符 














#include «sys/epoll.h» 





epoll 操 作 过 程 需要 3 个 接口 ， 分 别 如 下 : 


int epoll create (int 


int epoll ctl(int epfd, int op, int fd, struct epoll event *event); 


size); 


int epoll wait (int epfd, struct epoll event * events, int maxevents, int timeout); 


下 面 分 别 介绍 这 3 个 接口 的 功能 、 入 参 和 出 参 的 含义 。 











int epoll_create (int 


size); 








创建 一 个 epoll 的 句柄 ， 


下 如 果 查 看 /proc/ 进 程 的 id/fd/， 是 能 够 看 到 这 个 fd 值 的 ， 所 以 在 使 用 完 epoll 后 ， 必 须 调 有 








size 用 来 告诉 内 核 要 监听 的 数目 。 这 个 参数 不 同 于 select () 中 



































的 第 一 个 参数 ， 是 最 大 监听 的 fd+ 1 的 值 。 需 要 注意 的 是 ， 当 创建 好 epoll 句 柄 后 ， 它 就 会 占用 一 个 fd 值 ， 在 Linux 
close () 关闭 ， 否 则 可 能 导致 fd 被 耗 尽 。 














int epoll ctl(int epfd, int op, int fd, struct epoll event *event); 


epoll 的 事件 注册 函数 ， 





表示 : QEPOLL CTL ADD, 注册 新 的 fd 到 epfd 中 ; @EPOLL CTL_MOD， 修 改 已 经 注册 的 fd 的 监听 本 


它 不 同 于 select () 在 监听 事件 时 告诉 内 核 要 监听 什么 类 型 的 村 

















件 ， 而 是 先 注册 


监听 的 






































件 类 型 。 第 一 个 参数 是 epoll_create () 的 返回 值 ， 第 二 个 参数 表示 动作 ， 














S+; GEPOLL CTL DEL: 从 epfd 中 删除 一 个 fd。 


第 3 个 参数 是 需要 监听 的 fd， 第 4 个 参数 是 告诉 内 核 需 要 监听 什么 事 ，struct epoll_event 结 构 如 下 : 


struct epoll event ( 
. uint32 t events; 
epoll data t data; 
H 


/* Epoll events */ 
/* User data variable */ 





events 可 以 是 以 下 几 个 宏 的 集合 : DEPOLLIN， 表 示 对 应 的 文件 描述 符 可 以 读 (包括 对 端 SOCKET 正 常 关闭 ) ; @EPOLLOUT， 表 示 对 应 的 文件 描述 符 可 以 写 ; @EPOLLPRI， 表 示 对 应 的 文件 描述 符 








有 紧急 的 数据 可 读 (这 里 应 该 表示 有 带 外 数 折 
Triggered) 模式 ， 这 是 相对 于 水 平 触发 (Level Triggered) 来 说 的 ; DEPOLLONESHOT， 只 监听 一 次 导 


到 EPOLL 队 列 里 。 





居 到 来 ) ; @EPOLLERR， 表 示 对 应 的 文件 描述 符 发 生 错 误 ; @EPOLLHUP， 表 示 对 应 的 文件 描述 符 被 挂 断 ; @EPOLLET， 将 EPOLL 设 为 边缘 触发 (Edge 






































件 ， 当 监听 完 这 次 





件 之 后 ， 如 果 还 


需要 继续 监听 这 个 socket 的 话 ， 需 要 再 次 把 这 个 socket 加 入 





int epoll wait(int epfd, struct epoll event * events, int maxevents, int timeout); 














等 待 事件 的 产生 ， 类 似 于 select () 调用 。 参 数 events 用 来 从 内 核 得 到 事件 














是 超时 时 间 (ms 为 单位 ，0 会 立即 返回 ，- 1 将 不 确定 或 称 永久 阻塞 ) 。 该 函数 返 























2. 用 epoll 提 高 服务 器 的 处 理 能 力 


下 面 epoll 编 写 一 个 服务 器 ， 处 理 多 个 client 的 请 求 。 




















【 例 7.5】 ”用 epoll 处 理 服务 器 和 客户 端的 读 写 。 





server.cpp 的 代码 是 : 








[s] 








需要 处 理 的 事件 数 




















， 如 返回 





0 表示 已 超时 。 


的 集合 ，maxevents 告 诉 内 核 这 个 events 有 多 大 ， 且 maxevents 的 值 不 能 大 于 创建 epoll_create () 时 的 size， 参 数 timeout 





#include «stdio.h» 
#include <stdlib.h> 
#include <string.h> 
#include <errno.h> 


#include <netinet/in.h> 
#include «sys/socket.h» 


#include <arpa/inet. 
#include <sys/epoll. 
#include <unistd.h> 
#include <sys/types. 
#define IPADDRESS 
#define PORT 
#define MAXSIZE 
#define LISTENQ 
#define FDSIZE 
#define EPOLLEVENTS 
/* sik up, 


h> 
"127.0.0.1" 
6666 

1024 

5 

1000 

100 


/* pit 44k JC ub HE / 
int socket bind(const char* ip,int port); 


/*IO 多 路 复 用 epoll*/ 


void do epoll(int listenfd); 


/* 事 件 处 理 函 数 */ 


void handle events (int epollfd, struct epoll event *events,int num,int listenfd,char *buf); 


/* 处 理 接收 到 的 连接 */ 


void handle accpet (int epollfd,int listenfd); 


/* 读 处 理 */ 


void do read(int epollfd,int fd,char *buf); 


/* 写 处 理 */ 


void do write(int epollfd,int fd,char *buf); 


/* 添 加 事件 */ 


void add event(int epollfd,int fd,int state); 


/* 修 改 事 伞 */ 


void modify event (int epollfd,int fd,int state); 


[BUR E HEC 


void delete event(int epollfd,int fd,int state); 


int main(int argc,char *argv[])( 
int listenfd; 
listenfd = socket bind (IPADDRESS, PORT); 
listen (listenfd, LISTENQ) ; 
do epoll(istenfg); 
return 0; 


int socket bind(const char* ip,int port)í 
int listenfd; 
struct sockaddr in servaddr; 
listenfd = socket(AF INET,SOCK STREAM, 0); 


if (listenfd == -1)( 
perror("socket error:"); 
exit(1); 


} 

bzero (&servaddr, sizeof (servaddr)); 

servaddr.sin family = AF INET; 

inet pton(AF INET,ip,&servaddr.sin addr); 

servaddr.sin port = htons (port); 

if (bind(listenfd, (struct sockaddr*)&servaddr,sizeof(servaddr)) == -1)( 
perror("bind error: "); 
exit(1); 

} 

return listenfd; 

} 
void do epoll(int listenfd)( 

int epollfd; 

struct epoll event events [EPOLLEVENTS]; 

int ret; 

char buf[MAXSIZE]; 

memset (buf, 0, MAXSIZE) ; 

/* 创 建 一 个 描述 符 */ 

epollfd = epoll create (FDSIZE); 

/* 添 加 监听 描述 符 事 件 */ 

add event (epollfd, listenfd, EPOLLIN); 

while (1) { 
/* 获 取 已 经 准备 好 的 描述 符 事件 */ 
ret = epoll wait (epollfd,events,EPOLLEVENTS, -1); 
handle events (epollfd, events, ret, listenfd, buf) ; 


} 
close (epollfd); 


void handle events (int epollfd,struct epoll event *events,int num,int listenfd,char *buf)( 
int i; 
int fd; 
/* 进 行 选 好 遍历 */ 
for (i = 0;i < num;i++){ 
fd = events[i].data.fd; 
/* 根 据 描述 符 的 类 型 和 事件 类 型 进行 处 理 */ 
if ((fd == listenfd) &&(events[i].events & EPOLLIN)) 
handle accpet (epollfd,listenfd); 
else if (events[i].events & EPOLLIN) 
do read (epollfd, fd,buf); 
else if (events[i].events & EPOLLOUT) 
do write (epollfd,fd,buf); 
} 


} 
void handle accpet(int epollfd,int listenfd)( 
int clifd; 
struct sockaddr in cliaddr; 
socklen t cliaddrlen; 
clifd = accept (listenfd, (struct sockaddr*) &cliaddr, &cliaddrlen); 
if (clifd — -1) 
perror("accpet error:"); 
elset 
printf("accept a new client: $s:$dWn",inet ntoa(cliaddr.sin addr),cliaddr.sin port); 
/* 添 加 一 个 客户 描述 符 和 事件 */ 
add event (epollfd, clifd,EPOLLIN) ; 
} 
} 
void do read(int epollfd,int fd,char *buf){ 
int nread; 
nread = read(fd,buf,MAXSIZE); 


if (nread == -1)( 
perror ("read error:"); 
close (fd); 
delete event (epollfd, fd, EPOLLIN); 
else if (nread == 0){ 
fprintf (stderr, "client close. Mn"); 
close (fd); 


delete_event (epollfd, fd, EPOLLIN) ; 
} 
elset 
printf ("read message is : $s",buf); 
/* 修 改 描述 符 对 应 的 事件 ， 由 读 改 为 写 */ 
modify event (epollfd, fd, EPOLLOUT) ; 
} 
} 
void do write(int epollfd,int fd,char *buf)( 
int nwrite; 
nwrite = write (fd,buf, strlen (buf) ); 
if (nwrite = -1){ 
perror ("write error:"); 
close (fd) ; 
delete_event (epollfd, fd, EPOLLOUT) ; 





} 
else 

modify_event (epollfd, fd, EPOLLIN) ; 
memset (buf, 0, MAXSIZE) ; 


} 
void add event(int epollfd,int fd,int state){ 
struct epoll event ev; 
ev.events = state; 
ev.data.fd - fd; 
epoll ctl(epollfd,EPOLL CTL ADD, fd, &ev); 


} 
void delete event(int epollfd,int fd,int state) { 
struct epoll event ev; 
ev.events = state; 
ev.data.fd - fd; 
epoll ctl(epollfd,EPOLL CTL DEL, fd, &ev); 


} 
void modify event (int epollfd,int fd,int state)( 
struct epoll event ev; 
ev.events = state; 
ev.data.fd - fd; 
epoll ctl(epollfd,EPOLL CTL MOD, fd, &ev); 




















客户 端 也 用 epoll 实 现 ， 控 制 STDIN_FILENO、STDOUT_FILENO 和 sockfd 3 个 描述 符 。 


client.cpp 的 代码 是 : 





#include <netinet/in.h> 
#include <sys/socket.h> 
#include <stdio.h> 
#include <string.h> 
#include <stdlib.h> 
#include <sys/epoll.h> 
#include <time.h> 
#include <unistd.h> 
#include <sys/types.h> 
#include <arpa/inet.h> 


#define MAXSIZE 1024 
#define IPADDRESS "127.0.0.1" 
fdefine SERV PORT 6666 
#define FDSIZE 1024 
#define EPOLLEVENTS 20 
void handle connection(int sockfd); 
void handle events (int epollfd,struct epoll event *events,int num,int sockfd,char *buf); 
void do read(int epollfd,int fd,int sockfd,char *buf); 
void do read (int epollfd,int fd,int sockfd,char *buf); 
void do write(int epollfd,int fd,int sockfd,char *buf); 
void add event (int epollfd,int fd,int state); 
void delete event (int epollfd,int fd,int state); 
void modify event(int epollfd,int fd,int state); 
int count-0; 
int main(int argc,char *argv[])t 
int Socktd; 
struct sockaddr in servaddr; 
Sockfd = socket(AF INET,SOCK STREAM, 0); 
bzero(&servaddr, sizeof (servaddr) ); 
servaddr.sin family = AF INET; 
servaddr.sin port = htons (SERV PORT); 
inet pton(AF INET,IPADDRESS, &servaddr.sin addr); 
connect (sockfd, (struct sockaddr*) &servaddr, sizeof (servaddr)); 
/* 处 理 连接 */ 
handle connection (sockfQ); 
close (sockfd); 
return 0; 


void handle connection (int sockfd)( 
int epollfd; 
struct epoll event events [EPOLLEVENTS]; 
char buf|[MAXSIZE]; 
int ret; 
epollfd = epoll create (FDSIZE); 
add event (epollfd, STDIN FILENO, EPOLLIN); 
while (1) ( 
ret = epoll wait (epollfd, events, EPOLLEVENTS, -1); 
handle events (epollfd, events, ret, sockfd, buf) ; 
l 
close (epollfd); 
} 
void handle events(int epollfd,struct epoll event *events,int num,int sockfd,char *buf){ 
int fd; T 
int i; 
for (i 0;i < mmzi++){ 
fd = events[i].data.fd; 
if (events[i].events & EPOLLIN) 
do read (epollfd, fd, sockfd, buf) ; 
else if (events[i].events & EPOLLOUT) 
do write (epollfd, fd, sockfd, buf); 
} 
} 
void do read(int epollfd,int fd, int sockfd,char *buf){ 
int nread; 
nread = read(fd,buf,MAXSIZE); 
if (nread —z 
perror ("read error:"); 
close (fd); 








else if (nread == 0){ 
fprintf (stderr, "server close. Wn"); 
close (fd); 
} 
else( 
if (fd -- STDIN FILENO) 
add event (epollfd, sockfd, EPOLLOUT) ; 
else( ^ 
delete event (epollfd, sockfd, EPOLLIN); 
add event (epollfd,STDOUT FILENO, EPOLLOUT); 


$ 

} 

void do write(int epollfd,int fd,int sockfd,char *buf){ 
int nwrite; 
char temp[100]; 
buf[strlen (buf)-1]-2'N0'; 
snprintf (temp, sizeof (temp) , "$s $02dWMn",buf,count-t); 
nwrite = write (fd, temp, strlen (temp) Me 


if (nwrite == -1)( 
perror("write error:"); 
close (fd); 

} 

else{ 


if (fd == STDOUT_FILENO) 

delete event(epollfd, fd, EPOLLOUT) ; 
else 

modify event (epollfd, fd, EPOLLIN); 


} 
memset (buf, 0, MAXSIZE) ; 


} 
void add event(int epollfd,int fd,int state){ 
struct epoll event ev; 
ev.events = state; 
ev.data.fd - fd; 
epoll ctl(epollfd,EPOLL CTL ADD, fd, &ev); 


} 
void delete event (int epollfd,int fd,int state)( 
struct epoll event ev; 
ev.events = state; 
ev.data.fd - fd; 
epoll ctl(epollfd,EPOLL CTL DEL, fd, &ev); 


} 
void modify event (int epollfd,int fd,int state){ 
struct epoll event ev; 
ev.events = state; 
ev.data.fd - fd; 
epoll ctl(epollfd,EPOLL CTL MOD, fd, &ev); 








程序 的 执行 结果 如 








7-14 所 示 : 
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7-14 例 7.5 程 序 执行 结果 图 











程序 将 各 个 模块 的 功能 写 在 各 个 函数 中 ， 这 样 代码 阅读 起 来 会 更 清晰 。 


server.cpp 中 ， 主 函数 main 中 只 有 3 个 动作 : 绑 定 套 接 字 、 监 听 套 接 字 以 及 利用 epoll 处 理 读 写 操作 。 





int main(int argc,char *argv[]l)t 
int listenfd; 
listenfd = socket bind(IPADDRESS, PORT); 
listen (listenfd, LISTENQ) ; 
do epoll(listenfd); 
return 0; 























SE EE SS UT ERESEDUARTIRESTEBUIRDU-T PAAA, REAR. "RIBERA fAuDMFBepoll&ii, KREA epo event TRAA, xdbtGselectiüpolln]LU8 
到 ，select 用 的 是 fd_set 的 结构 体 ，poll 用 的 是 以 结构 体 pollfd 为 元 素 的 数组 ，3 个 函数 使 用 的 结构 都 不 一 样 。 先 把 监听 描述 符 加 入 到 事件 列表 中 ，select 和 poll 也 是 先 把 监听 描述 符 加 入 到 各 自 的 结构 中 。 这 
里 还 要 再 创建 epollfd， 这 个 设置 与 select 和 poll 都 不 一 样 。 













































































void do epoll(int listenfd)( 

int epollfd; 

struct epoll event events [EPOLLEVENTS]; 

int ret; T 

char buf[MAXSIZE]; 

memset (buf, 0, MAXSIZE) ; 

/* 创 建 一 个 描述 符 */ 

epollfd = epoll create (FDSIZE); 

/* 添 加 监听 描述 符 事件 */ 

add event (epollfd,listenfd,EPOLLIN); 

while(1)( 
/* 获 取 已 经 准备 好 的 描述 符 事件 */ 
ret = epoll wait (epollfd, events, EPOLLEVENTS, -1); 
handle events (epollfd, events, ret,listenfd,buf); 

} 

close (epollfd); 





获取 到 已 经 准备 好 的 描述 符 事件 后 ， 根 据 描述 符 的 类 型 和 事件 类 型 进行 处 理 。 如 果 描述 符 是 监听 描述 符 且 事件 可 读 时 ， 就 可 以 接收 新 的 客户 端 请 求 ， 如 果 事件 仅 为 可 读 ， 则 读 取 老 客户 端 发 过 来 的 包 ; 
如 果 事件 为 可 写 ， 则 发 包 ，。 

















void handle events(int epollfd,struct epoll event *events,int num,int listenfd,char *buf){ 
int i; 
int fd; 
/* 进 行 选 好 遍历 */ 
for (i = 0;i < num;i++){ 
fd = events[i].data.fd; 
/* 根 据 描述 符 的 类 型 和 事件 类 型 进行 处 理 */ 
if ((fd == listenfd) &&(events[i].events & EPOLLIN)) 
handle accpet (epollfd,listenfd); 
else if (events[i].events & EPOLLIN) 
do read (epollfd, fd, buf) ; 
else if (events[i].events & EPOLLOUT) 
do write (epollfd, fd,buf); 














由 于 这 里 设计 的 是 服务 器 会 根据 客户 端 发 来 的 内 容 同 样 地 回 包 ， 所 以 读 到 数据 后 ， 要 把 事件 转 为 可 写 状态 ， 由 写 事件 进行 发 包 。 读 操作 失败 了 或 结束 后 ， 就 需要 关闭 相应 的 rd， 并 把 读 状态 的 事件 删 




















void do read(int epollfd,int fd,char *buf){ 
int nread; 
nread = read(fd,buf,MAXSIZE); 


if (nread == -1){ 
perror ("read error:"); 
close (fd); 


delete event (epollfd, fd, EPOLLIN); 


else if (nread == { 
fprintf (stderr, "client close.\n"); 
close (fd); 
delete_event (epollfd, fd, EPOLLIN) ; 
l 
else{ 
printf ("read message is : %s",buf); 
/* 修 改 描述 符 对 应 的 事件 ， 由 读 改 为 写 */ 
modify event (epollfd, fd, EPOLLOUT) ; 
} 


























若 写 操作 失败 了 ， 要 将 其 从 写 事件 列表 里 删除 ; 若 写 操作 成 功 了 ， 还 要 继续 检测 是 否 有 数据 ， 有 的 话 继续 读 入 。 











void do write(int epollfd,int fd,char *buf){ 

int nwrite; 
nwrite = write (fd,buf, strlen (buf) ); 
if (nwrite == -1)( 

perror("write error:"); 

close (fd); 

delete event (epollfd, fd, EPOLLOUT) ; 
} 
else 

modify event (epollfd, fd, EPOLLIN); 
memset (buf, 0, MAXSIZE) ; 











添加 、 删 除 、 修 改 事件 ， 都 是 用 epoll_ctr 函 数 ， 只 是 第 二 个 参数 不 同 ， 分 别 是 EPOLL_CTL_ ADD, EPOLL CTL DEL, EPOLL CTL MOD， 各 自 代 码 如 下 : 











epoll ctl(epollfd,EPOLL CTL ADD, fd, &ev); 
epoll ctl(epollfd,EPOLL CTL DEL, fd, &ev); 
epoll ctl(epollfd,EPOLL CTL MOD, fd, &ev); 








client.cpp 中 ， 则 需要 关注 三 种 状态 : @ 标 准 输入 ;@ 服 务 器 发 来 了 数据 ; @@ 标 准 输出 (把 服务 器 的 东西 发 过 来 的 打印 到 标准 输出 上 ) 。 客 户 端 中 第 一 个 加 入 epollfd 的 是 STDIN_FILENO， 即 标准 输入 
状态 ， 因 为 是 等 待 客户 端 输入 字符 串 ， 服 务 器 才 会 回应 相应 的 字符 串 。 





















































处 理 读 事件 要 注意 ， 由 于 读 事 件 有 两 个 触发 点 : 标准 输入 和 服务 器 发 来 了 数据 。 所 以 ， 如 果 是 从 标准 输入 读 来 的 数据 ， 要 接着 去 发 给 服务 器 ， 要 加 一 个 写 状 态 的 事件 ， 并 且 还 要 继续 往 标准 输入 里 输入 
东西 ， 所 以 这 个 读 事件 不 改变 状态 。 如 果 是 从 服务 器 读 来 的 数据 ， 则 要 将 其 输出 到 标准 输出 中 ， 并 把 读 事件 删除 ， 加 上 写 事件 。 



































void do read(int epollfd,int fd, int sockfd,char *buf)( 


int nread; 
nread = read(fd,buf,MAXSIZE); 


if (nread == -1){ 
perror ("read error:"); 
close (fd); 
else if (nread == 0){ 
fprintf (stderr, "server close. Mn"); 
close (fd); 


} 
else( 
if (fd == STDIN FILENO) 


add event (epollfd, sockfd, EPOLLOUT) ; 


else( 


delete event (epollfd, sockfd, EPOLLIN); 
add event (epollfd, STDOUT FILENO, EPOLLOUT); 


























处 理 写 事件 时 也 要 注意 














， 有 两 种 写 事件 : 向 标准 输出 里 写 或 向 网 络 中 写 (给 服务 器 发 包 ) 。 
能 发 过 来 的 数据 ， 并 要 改变 事件 状态 。 


void do write(int epollfd,int fd,int sockfd,char *buf){ 


int nwrite; 
char temp[100]; 
buf[strlen (buf)-1]-2'N0'; 
snprintf (temp, sizeof (temp) , 





"gs $02dWMn",buf,count-t); 


nwrite = write (fd, temp, strlen (temp) ys 


if (nwrite == -1)( 


perror("write error:"); 
close (fd); 

} 

else{ 


if (fd == STDOUT_FILENO) 


delete | event (epollfd, fd, EPOLLOUT) ; 


else 


modify event (epollfd, fd, EPOLLIN); 


} 
memset (buf, 0, MAXSIZE); 


从 执行 结果 中 可 以 看 出 ， 比 如 客户 





端 给 服务 器 发 了 “aaaaaa_00” 








只 有 在 调用 write 函数 时 才 会 自 增 ) ， 如 图 
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elect、poll 和 epoll 都 是 多 路 IO 复 用 的 机 制 。 多 路 IO 


7-15 所 示 。 
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如 果 是 往 标准 输出 里 写 ， 操 作 结 束 就 应 删除 如 


， 客 户 端 最 终 输 出 到 标准 输出 的 是 “aaaaaa_00 O1" , 


就 通过 一 种 机 制 ， 可 以 监视 多 个 描述 符 ， 
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47-15 ” 例 7.5 程 序 执行 结果 图 


一 旦 某 个 描述 符 就 绪 (一 般 是 读 就 绪 或 者 写 就 绪 ) ， 

















poll 和 epoll 本 质 上 都 是 同步 /O， 因 为 它们 都 需要 在 读 写 事件 就 绪 后 自 





























下 面 对 这 3 种 多 路 IO 





进行 对 比 。 
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4t; 但 是 如 果 向 网 络 中 写 ， 操 作 结 束 后 仍 要 继续 读 服务 器 有 可 





这 也 证 明了 给 服务 器 发 包 和 输出 数据 到 标准 输出 时 ， 用 的 是 write 函数 (Count 








能 够 通知 程序 进行 相应 的 读 写 操作 。 但 select、 





























己 负责 进行 读 写 ， 即 是 阻塞 的 ,而 异 : 








步 10 则 无 须 自己 负责 进行 读 写 ， 异 步 |/O 的 实现 会 负责 把 数据 从 内 核 拷 贝 到 用 户 空间 。 








(1) 首先 还 是 来 看 常见 的 select () 和 poll () 。 对 于 网 络 编程 来 说 ， 一 般 认 为 poll () 比 select () 要 高 级 一 些 ， 这 主要 源 于 以 下 几 个 原因 。 





1) poll () 不 要 求 开发 者 在 计算 最 大 文件 描述 符 时 进行 +1 的 操作 。 














2) poll () 在 应 付 大 数目 的 文件 描述 符 的 时 候 速度 更 快 ， 因 为 对 于 select () 来 说 内 核 需 要 检查 大 量 描述 符 对 应 的 fd_set 中 的 每 一 个 比特 位 ， 比 较 费 时 。 


























3) select () 可 以 监控 的 文件 描述 符 数目 是 固定 的 ， 相 对 来 说 也 较 少 (1024 或 2048) 。 如 果 需 要 监控 数值 比较 大 的 文件 描述 符 ， 或 是 分 布 得 很 稀 琉 的 较 少 的 描述 符 ， 效 率 也 会 很 低 。 而 对 于 poll () && 
数 来 说 ， 就 可 以 创建 特定 大 小 的 数组 来 保存 监控 的 描述 符 ， 而 不 受 文件 描述 符 值 大 小 的 影响 ， 而 且 poll () 可 以 监控 的 文件 数目 远大 于 select () 。 





4) 对 于 select () 来 说 ， 所 监控 的 fd_set 在 select () 返回 之 后 会 发 生变 化 ， 所 以 在 下 一 次 进入 select () 之 前 都 需要 重新 初始 化 需要 监控 的 fd_set，poll () 函数 将 监控 的 输入 和 输出 事件 分 开 ， 人 允许 
被 监控 的 文件 数组 被 复 用 而 不 需要 重新 初始 化 。 












































5) select () 函数 的 超时 参数 在 返回 时 也 是 未 定义 的 ， 考 虑 到 可 移植 性 ， 每 次 在 超时 之 后 在 下 一 次 进入 到 select () 之 前 都 需要 重新 设置 超时 参数 。 





(2) select () 的 优点 如 下 所 述 。 


1) select () 的 可 移植 性 更 好 ， 在 某 些 UNIX 系 统 上 不 支持 poll () 。 





2) select () 对 于 超时 值 提供 了 更 好 的 精度 ， 而 poll () 是 精度 较 差 。 
(3) epoll 的 优点 如 下 所 述 。 
1) 支持 一 个 进程 打开 大 数目 的 socket 描 述 符 (FD) 。 


select () 最 不 能 忍受 的 是 一 个 进程 所 打开 的 FD 是 有 一 定 限制 的 ， 由 FD_SETSIZE 的 默认 值 是 1024/2048。 对 于 那些 需要 支持 上 万 连接 数目 的 1M 服务 器 来 说 显然 太 少 了 。 这 时 候 可 以 选择 修改 这 个 宏 然 
后 重新 编译 内 核 。 不 过 epol 则 没有 这 个 限制 ， 它 所 支持 的 FD 上 限 是 最 大 可 以 打开 文件 的 数目 ， 这 个 数字 一 般 远 大 于 2048。 举 个 例子 ， 在 1GB 内 存 的 空间 中 这 个 数字 一 般 是 10 万 左右 ， 具 体 数目 可 以 使 
cat/proc/sys/fs/file-max 查 看 ， 一 般 来 说 这 个 数目 和 系统 内 存 关系 很 大 。 










































































2) 10 效 率 不 随 FD 数 目 增加 而 线性 下 降 。 


传统 的 select/poll 男 一 个 致命 弱点 就 是 当 你 拥有 一 个 很 大 的 socket 和 集合， 不 过 由 于 网 络 延 迟 ， 任 一 时 间 只 有 部 分 的 socket 是 “活跃 ”的 ,但 是 select/poll 每 次 调用 都 会 线性 扫描 全 部 的 集合 ， 导 致 效率 
呈现 线性 下 降 。 但 是 epoll 不 存在 这 个 问题 ， 它 只 会 对 “活跃 ”的 socket 进 行 操作 一 一 这 是 因为 在 内 核 中 实现 epoll 是 根据 每 个 fd 上 面 的 callback 函 数 实 现 的 。 那 么 ， 只 有 “活跃 ”的 socket 才 会 主动 去 调 
callback 函 数 ， 其 他 idle 状 态 socket 则 不 会 ， 在 这 点 上 ，epoll 实 现 了 一 个 “ 伪 ”AlIO， 因 为 这 时 候 推动 力 由 Linux 内 核 提供 。 










































































3) 使 用 mmap 加 速 内 核 与 用 户 空间 的 消息 传递 。 







































































这 点 实际 上 涉及 epoll 的 具体 实现 。 无 论 是 select、poll 还 是 epoll 都 需要 内 核 把 fd 消息 通知 给 用 户 空间 ， 如 何 避 免 不 必 要 的 内 存 拷贝 就 显得 尤为 和 
同一 块 内 存 实现 的 。 

















man 








。 在 这 点 上 ，epoll 是 通过 内 核 与 用 户 空间 mmap 处 于 























对 于 poll 来 说 需要 将 用 户 传 入 的 pollfd 数 组 拷贝 到 内 核 空间 ， 因 为 拷贝 操作 和 数组 长 度 相关 ， 时 间 上 来 看 ， 这 是 一 个 O(n) 操作 ， 当 事件 发 生 后 ，poll 将 获得 的 数据 传送 到 用 户 空间 ， 并 执行 释放 内 存 
和 录 离 等 待 队列 等 工作 ， 向 用 户 空间 拷贝 数据 与 剥离 等 待 队列 等 操作 的 时 间 复 杂 度 同样 是 O(n) 。 












































7.5 NEM 


本 章 讲述 了 网 络 IO 模 型 ，select、poll 和 epoll 用 法 ， 可 以 用 这 些 模型 或 函数 提供 服务 器 的 并 发 处 理 能 力 ， 以 节约 机 器 成 本 。 


第 8 章 会 继续 学 习 网 格 的 常用 分 析 工 具 。 


第 8 章 网络 分 析 工 具 


前 面 介 绍 了 程序 网 络 间 的 通信 ， 但 在 处 理 定位 问题 或 者 多 方 联 调 时 ， 网 络 分 析 工 具 往往 会 派 上 用 场 。 本 章 主 要 讲 ping、tcpdump、netstat 和 lsof 这 4 个 网 络 分 析 工具 的 使 用 。 
8.1 ping 
1.ping 介 绍 




















ping (Packet Internet Groper， 因 特 网 包 探索 器 ) 是 Windows、UNIX 和 Linux 系 统 下 的 一 个 命令 。ping 也 属于 一 个 通信 协议 ， 是 TCP/IP 协 议 的 一 部 分 。 利 用 ping 命 令 可 以 检查 网 络 是 否 连 通 ， 可 以 
很 好 地 帮助 分 析 和 判定 网 络 故障 。 应 用 格式 : ping 空 格 IP 地 址 ， 该 命令 还 可 以 加 许多 参数 使 用 ， 如 图 8-1 所 示 。 
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图 8-1 ”执行 ping 命 令 可 以 看 到 可 使 用 的 参数 














ping 发 送 一 个 ICMP (Internet Control Messages Protocol， 因 特 网 信 报 控制 协议 ) ， 请 求 消息 给 目的 地 并 报告 是 否 收 到 所 希望 的 CMP echo (ICMP 回 声 应 答 ) ， 来 检查 网 络 是否 通 畅 或 者 网 
络 连 接 速 度 的 命令 。 作 为 一 个 后 台 开发 者 ，ping 是 一 个 必须 掌握 的 命令 。 它 所 利用 的 原理 是 这 样 的 : 利用 网 络 上 机 器 IP 地 址 的 唯一 性 ， 给 目标 IP 地 址 发 送 一 个 数据 包 ， 再 要 求 对 方 返回 一 个 同样 大 小 的 数据 
包 来 确定 两 台 网 络 机 器 是 否 连 接 相 通 以 及 时 延 是 多 少 。 




































































ent 通常 用 来 作为 可 用 性 的 检查 ， 但 是 某 些 病毒 木马 会 强行 大 量 远程 执行 ping 命 令 来 抢占 你 的 网 络 资源 ， 导 致 系统 、 网 速 变 慢 。 严 禁 ping 入 侵 作为 大 多 数 防火 墙 的 一 个 基本 功能 提 
供给 用 户 进行 选择 。 通 常 的 情况 下 你 如 果 不 用 作 服 务 器 或 者 进行 网 络 测试 ， 可 以 放心 的 选中 它 ， 以 保护 你 的 计算 机 。 
















































































网 络 连 通 问 题 是 由 许多 原因 引起 的 ， 如 本 地 配置 错误 、 远 程 主机 协议 失效 等 ， 当 然 还 包括 设备 等 造成 的 故障 。 使 用 ping 检 查 连通 性 有 以 下 6 个 步骤 。 


























(1) 使 用 ipconfig/all 观 察 本 地 网 络 设置 是 否 正确 。 


























(2) ping 127.0.0.1， 来 检查 本 地 的 TCP/IP 协 议 有 没有 设置 好 ， 如 图 8-2 所 示 。 


(3) ping 本 机 IP 地 址 ， 这 样 是 为 了 检查 本 机 的 IP 地 址 是 否 设置 有 误 。 








(4) ping 本 网 网 关 或 本 网 IP 地 址 ， 这 样 的 是 为 了 检查 硬件 设备 是 否 有 问题 ， 也 可 以 检查 本 机 与 本 地 网 络 连 接 是 否 正 常 。 (在 非 局 域 网 中 这 一 步骤 可 以 忽略 ) 





(5) ping 本 地 DNS 地 址 ， 这 样 做 是 为 了 检查 本 地 DNS 服 务 器 是 否 工作 正常 。 























(6) ping 远 程 IP 地 址 ， 这 主要 是 检查 本 网 或 本 机 与 外 部 的 连接 是 否 正 常 。ping 远 程 IP 地 址 还 可 以 用 来 测试 网 络 延 时 。 比 如 输入 “ping www.baidu.com” (百度 域名 ) 之 后 屏幕 会 显示 如 图 8-3 所 示 的 
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图 8-2 ”ping127.0.0.1 检 查 本 地 的 TCP/IP 协 议 有 没有 设置 好 
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图 8-3 ping 百 度 域名 会 发 出 的 包 











司 8-3 中 可 以 看 到 ， 向 百度 域名 发 了 7 个 包 ， 对 方 7 个 都 收 到 了 ， 没 有 丢 包 ， 共 耗 时 6113ms，RTT (一 个 连接 的 往返 时 间 ) 的 最 小 、 平 均 、 最 大 和 算术 平均 差分 别 是 15.712ms、15.744ms、15.796ms 和 











面 的 time=15.7ms 是 响应 时 间 ， 这 个 时 间 越 小 ， 说 明 连 接 的 这 个 地 址 速度 越 快 。 
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从 图 8-4 也 可 以 看 到 ， 用 ping 命 令 还 可 以 寻找 固定 网 站 网 址 的 IP 地 址 。 其 中 的 115.239.210.27 也 是 www.baidu.com 其 中 的 一 台 机 器 的 IP 地 址 ， 在 浏览 器 输入 这 个 地 址 ， 发 现 也 跳 转 到 了 百度 首页 。 














图 8-4 在 浏览 器 中 访问 bing 得 到 的 IP 地 址 














Linux 的 ping 语 法 和 Windows 的 差不多 ， 但 是 Linux 的 ping 数 据 包 是 64Byte， 而 Windows 的 是 32Byte，Windows 下 默认 发 送 4 次 数据 包 后 结束 ，Linux 下 的 ping 程 序 默认 不 停 发 送 数据 包 ， 直 到 用 户 手 
动 停止 (停止 指令 是 Ctrl+c) 。 


























8.2 tcpdump 


1.tcpdump 介 绍 


tcpdump 可 以 将 网 络 中 传送 的 数据 包 的 “ 头 ” 完 全 截获 下 来 提供 分 析 。 它 支持 针对 协议 、 主 机 、 网 络 或 端口 的 过 滤 ， 并 提供 and、or、not 等 逻辑 语句 来 帮助 去 掉 无 用 的 信息 。 简 单 来 说 ，tcpdump 就 
是 一 种 免费 的 网 络 分 析 工具 ， 而 且 它 提供 了 源 代 码 ， 公 开 了 接口 ， 因 此 具备 很 强 的 可 扩展 性 ， 对 于 网 络 维护 和 防止 入 侵 都 是 非常 有 用 的 工具 。tcpdump 存 在 于 基本 的 FreeBSD 系 统 中 ， 由 于 它 需 要 将 网 络 界 
面 设置 为 混杂 模式 ， 普 通用 户 不 能 正常 执行 ， 但 具备 root 权 限 的 用 户 可 以 直接 执行 它 来 获取 网 络 上 的 信息 。 因 此 系统 中 存在 网 络 分 析 工具 主要 不 会 对 本 机 安全 产生 威胁 ， 而 是 会 对 网 络 上 的 其 他 计算 机 的 安 
全 产生 威胁 。 



























































































































































tcpdump 根 据 使 用 者 的 定义 对 网 络 上 的 数据 包 进 行 截获 和 分 析 。 作 为 互联 网 上 经 典 的 系统 管理 员工 具 ，tcpdump 以 其 强大 的 功能 ， 灵 活 的 截取 策略 ， 成 为 每 个 高 级 的 系统 管理 员 分 析 网 络 、 排 查 问题 等 
所 必 备 的 工具 之 一 。 





















































tcpdump 支 持 相当 多 的 不 同 参 数 ， 如 使 用 -i 参数 指定 tcpdump 监 听 的 网 络 界面 ， 这 在 计算 机 具有 多 个 网 络 界面 时 非常 有 用 ;使 用 -c 参 数 指定 要 监听 的 数据 包 数 量 ， 使 用 -w 参 数 指定 将 监听 到 的 数据 包 写 
入 文件 中 保存 ， 等 等 。 









































然而 更 复杂 的 tcpdump 参 数 是 用 于 过 滤 操 作 ， 这 是 因为 网 络 中 流量 很 大 ， 如 果 不 加 分 辨 地 将 所 有 的 数据 包 都 截留 下 来 ， 可 能 会 因为 数据 量 太 大 ， 反 而 不 容易 发 现 需要 的 数据 包 。 使 用 这 些 参数 定义 的 过 
滤 规则 可 以 截留 特定 的 数据 包 ， 以 缩小 目标 ， 才 能 更 好 地 分 析 网 络 中 存在 的 问题 。tcpdump 使 用 参数 指定 要 监视 数据 包 的 类 型 、 地 址 、 端 口 等 ， 根 据 具 体 的 网 络 问题 ， 充 分 利用 这 些 过 滤 规 则 就 能 达到 迅速 
定位 故障 的 目的 。 下 面 将 介绍 如 何 使 用 tcpdump。 



















































































2.tcpdump 使 用 


tcpdump 采 用 命令 行 方 式 ， 它 的 命令 格式 为 : 





tcpdump [ -adeflnNOpqStvx ] [ -c 数量 ] [ -F 文件 名 ] [ -i 网 络 接口 ] [ -r 文件 名 ] [ -s snaplen ][ -T 类 型 ] [ -w 文件 名 ] [表达 式 ] 








表达 式 是 一 个 正则 表达 式 ，tcpdump 利 用 它 作为 过 滤 报 文 的 条 件 ， 如 果 一 个 报 文 满足 表达 式 的 条 件 ， 则 这 个 报 文 将 会 被 捕获 。 如 果 没有 给 出 任何 条 件 ， 则 网 络 上 所 有 的 信息 包 将 会 被 截获 。 在 表达 式 中 
一 般 包 含 如 下 几 种 类 型 的 关键 字 。 











1) 关于 类 型 的 关键 字 ， 主 要 包括 host、net、port 等 ， 例 如 host 210.27.48.2 即 指明 210.27.48.2 是 一 台 主 机 ，net 202.0.0.0 指 明 202.0.0.0 是 一 个 网 络 地 址 ，port 23 指 明 端 口号 是 23。 如 果 没 有 指定 类 
型 ， 默 认 的 类 型 是 host。 

















2) 确定 传输 方向 的 关键 字 ， 主 要 包括 src、dst、dst or src、dst、src 等 ， 这 些 关 键 字 指明 了 传输 的 方向 。 举 例 说 明 ，src 210.27.48.2， 指 明 IP 包 中 源 地 址 是 210.27.48.2，dst net 202.0.0.0 指 明 目 的 网 
络 地 址 是 202.0.0.0。 如 果 没 有 指明 方向 关键 字 ， 则 默认 是 src or dst 关 键 字 。 





























3) 协议 的 关键 字 ， 主 要 包括 fddi、ip、arp、rarp、tcp、udp 等 类 型 。fddi 指 明 是 在 FDDI (分 布 式 光纤 数据 接口 网 络 ) 上 的 特定 的 网 络 协议 ， 实 际 上 它 是 ether 的 别名 ，fddi 和 ether 具 有 类 似 的 源 地 址 
和 目的 地 址 ， 所 以 可 以 将 fddi 协 议 包 当 作 ether 的 包 进行 处 理 和 分 析 。 其 他 的 几 个 关键 字 就 是 指明 了 监听 的 包 的 协议 内 容 。 如 果 没 有 指定 任何 协议 ， 则 tcpdump 将 会 监听 所 有 协议 的 信息 包 。 






































除了 这 3 种 类 型 的 关键 字 之 外 ， 其 他 重要 的 关键 字 如 下 : gateway、broadcast、less、greater 等 ， 还 有 3 种 逻辑 运算 : 取 非 运算 not/! ， 与 运算 and/&&; 或 运算 oV||; 这 些 关键 字 可 以 组 合 起 来 构成 
强大 的 组 合 条 件 来 满足 人 们 的 需要 ， 下 面 举 几 个 例子 来 说 明 。 








1) 截取 某 主 机 相关 的 包 。 














a. 想 要 截获 所 有 210.27.48.1 的 主机 收 到 的 和 发 出 的 所 有 的 数据 包 ， 使 用 如 下 命令 : 











tcpdump host 210.27.48.1 

















b. 想 要 截获 主机 210.27.48.1 和 主机 210.27.48.2 或 210.27.48.3 的 通信 ， 使 用 如 下 命令 : (在 命令 行 中 使 用 括号 时 ， 一 定 要 添加 “^”) 














tcpdump host 210.27.48.1 and \ (210.27.48.2 or 210.27.48.3 \) 





<. 如 果 想 要 获取 主机 210.27.48.1 除 了 和 主机 210.27.48.2 之 外 所 有 主机 通信 的 ip 包 ， 使 用 如 下 命令 : 














tcpdump ip host 210.27.48.1 and ! 210.27.48.2 








d .如果 想 要 获取 主机 210.27.48.1 接 收 或 发 出 的 telnet 包 ， 使 用 如 下 命令 : 





tcpdump tcp port 23 host 210.27.48.1 


2) 截取 某 端 口 相关 的 包 。 








如 果 想 要 获取 在 端口 6666 上 通过 的 包 ， 使 用 如 下 命令 : 




















tcpdump port 6666 





3) 截取 某 网 卡 的 包 。 











如 果 想 要 获取 在 网 卡 eth1 上 通过 的 包 ， 使 用 如 下 命令 : 











tcpdump -iethl 


8.3 netstat 











netstat 命 令 用 于 显示 与 |P、TCP、UDP 和 ICMP 协 议 相关 的 统计 数据 ， 一 般 用 于 检验 本 机 各 端口 的 网 络 连 接 情况 。netstat 是 在 内 核 中 访问 网 络 及 相关 信息 的 程序 ， 它 能 提供 TCP 连 接 、 对 TCP 和 UDP 的 
监听 及 获取 进程 内 存 管理 的 相关 报告 。 












































计算 机 有 时 候 会 因 接 收 到 的 数据 报导 致 出 错 数据 或 故障 ，TCP/IP 可 以 容许 这 些 类 型 的 错误 ， 并 能 够 自动 重 发 数据 报 。 但 如 果 累 计 的 出 错 情况 数目 占 到 所 接收 的 |P 数 据 报 相 当 大 的 百分比 ， 或 者 它 的 数目 
正 迅速 增加 ， 那 么 就 应 该 使 用 netstat 查 一 查 为 什么 会 出 现 这 些 情况 了 。 























netstat 的 命令 格式 如 下 所 示 : 





netstat [-acCeFghilMnNoprstuvVwx] [-A< 网 络 类 型 >] [--ip] 








netstat 用 于 显示 与 |P、TCP、UDP 和 ICMP 协 议 相关 的 统计 数据 ， 一 般 用 于 检验 本 机 各 端口 的 网 络 连接 情况 。 





执行 netstat 命 令 后 ， 输 出 结果 如 图 8-5 所 示 。 














从 整体 上 看 ，netstat 的 输出 结果 可 以 分 为 两 个 部 分 : @Active Internet connections， 称 为 有 源 TCP 连 接 ， 其 中 Recv-Q 和 Send-Q 指 的 是 接收 队列 和 发 送 队 列 ， 这 些 数 字 一 般 都 应 该 是 0， 如 果 不 是 则 
表示 请 求 包 和 回 包 正在 队列 中 堆积 ，@Active UNIX domain sockets， 称 为 有 源 UNIX 域 套 接 口 (和 网 络 套 接 字 一 样 ， 但 是 只 能 用 于 本 机 通信 ， 性 能 可 以 提高 一 倍 ) 。 



































[sharexuglinux ~]$ netstat 

Active Internet connections (w/o servers) 

Proto /-Q Se 1 address j State 

tcp 384 3 42.06.142.120:emtp | 30. 1 enpc ESTABLISHED 
tcp B 42.96.142.129:ssh 115.24.141. ESTABLISHED 
Active UNIX domain sockets (W/o servers) 

Proto RefCnt Flags Type State e Path 

unix 7 a DGRAM " /dev/log 

unix DCGRAN 576 @/org/kernel/udev/udevd 

unix STRE AM CONNECTED 
unix STREAM CONNECTED 
unix DGRAM 

unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix STREAM CONNECTED 
Unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix STREAM CONNECTED 
unix DGRAM 

unix DGRAN 

unix DGRAM 

unix DGRAM 

unix DGRAM 

unix DGRAM 
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图 8-5 ”执行 netstat 命 令 查 看 网 络 端口 数据 





























Proto 显 示 连 接 使 用 的 协议 ，RefCnt 表 示 连 接 到 本 套 接口 上 的 进程 号 ，Types 显 示 套 接口 的 类 型 ，State 显 示 套 接口 当前 的 状态 ，Path 表 示 连 接 到 套 接口 的 其 他 进程 使 用 的 路 径 名 。 






































常见 参数 如 下 所 示 : 


L4 LISTENdS X 





该 netstat 命 令 。 提 示 : LISTEN 和 LISTENING 的 状态 只 有 用 -a 或 者 -1 才能 看 到 








各 参数 的 使 用 实例 如 下 所 述 。 














(1) 列 出 所 有 端口 (包括 监听 和 未 监听 的 ) : netstat-a。 





(2) 列 出 所 有 TCP 端 口 : netstat-at。 





(3) 列 出 所 有 UDP 端 口 : netstat-au。 





(4) 列 出 所 有 处 于 监听 状态 的 socket: netstat-|。 
(5) 列 出 所 有 监听 TCP 端 口 的 socket: netstat-lt。 


(6) 列 出 所 有 监听 UDP 端口 的 socket: netstat-lu。 











(7) 列 出 所 有 监听 UNIX 端 口 的 socket: netstat-Ix, 











(8) 在 netstat 输 出 中 显示 PID 和 进程 名 称 : netstat-p。 





























(9) 当 你 不 想 让 主机 ， 端 口 和 用 户 名 显示 ， 使 用 netstat-n， 将 会 使 用 数字 代 蔡 那些 名 称 。 









































(10) 持续 输出 netsta 信 息 : netstat-c, 


(11) 找 出 程序 运行 的 端口 : netstat-aplgrep ssh. 





(12) 找 出 运行 在 指定 端口 的 进程 ， 如 netstat-an|grep': 80 。 


(13) 显 式 网 络 接口 列表 : netstat-i。 











(14) IP 和 TCP 的 分 析 ， 如 查看 链接 某 服务 端口 最 多 的 IP 地 址 命令 是 : 











netstat-nat|grep"192.168.1.15: 22"|awk'(print$5)'lawk-F: "(print$1)'|sort[unig-c|sort-nr|head-20. 


(15) TCP 各 自 状态 列表 : netstat-nat|awk' (print$6)', 











(16) 先 把 各 种 TCP 状 态 全 都 取出 来 ， 然 后 使 用 uniq-c 统 计 ， 之 后 再 进行 排序 : netstat-natlawk'{print$6}'|sortluniq-c。 

















8.4 lsof 

















lsof (list open file) 是 一 个 列 出 当前 系统 打开 文件 的 工具 。 在 Linux 环 境 下 ， 任 何事 物 都 以 文件 的 形式 存在 ， 通 过 文件 不 仅仅 可 以 访问 常规 数据 ， 还 可 以 访问 网 络 连接 和 硬件 。 所 以 如 传输 控制 协议 
(TCP) 和 用 户 数据 报 协议 (UDP) 套 接 字 等 ， 系 统 在 后 台 都 为 该 应 用 程序 分 配 了 一 个 文件 描述 符 ， 无 论 这 个 文件 的 本 质 如 何 ， 该 文件 描述 符 为 应 用 程序 与 基础 操作 系统 之 间 的 交互 提供 了 通用 接口 。 因 为 
应 用 程序 打开 文件 的 描述 符 列表 提供 了 大 量 关 于 这 个 应 用 程序 本 身 的 信息 ， 因 此 通过 lsof 工 具 能 够 查看 这 个 列表 对 系统 监测 以 及 排 错 将 是 很 有 帮助 的 。 






































































































































在 终端 下 输入 lsof 即 可 显示 系统 打开 的 文件 ， 因 为 lsof 需 要 访问 核心 内 存 和 各 种 文件 ， 所 以 必须 以 root 用 户 的 身份 运行 才能 够 充分 地 发 挥 其 功能 

















执行 Isof 命 令 后 ， 输 出 结果 如 图 8-6 所 示 。 




















图 8-6 ”执行 lsof 命 令 结果 











(1) 每 行 显示 一 个 打开 的 文件 ， 若 不 指定 条 件 默认 将 显示 所 有 进程 打开 的 所 有 文件 。lsof 输 出 各 列 信息 的 意义 如 下 所 述 。 


A 


COMMAND: 进程 的 名 称 。 


w 


PID: 进程 标识 符 。 


3) USER: 进程 所 有 者 。 


也 


FD: 文件 描述 符 ， 应 用 程序 通过 文件 描述 符 识别 该 文件 如 cwd、txt 等 。 


5) TYPE: 文件 类 型 ， 如 DIR、REG 等 。 


9 


DEVICE: 指定 磁盘 的 名 称 。 


7) SIZE: 文件 的 大 小 。 


e 


NODE: 索引 节点 (文件 在 磁盘 上 的 标识 ) 。 





9) NAME: 打开 文件 的 确切 名 称 。 


(2) lsof 语 法 格式 是 : 





lsof [options] filename 














(3) 常用 的 参数 列表 : 











lsof filename 显示 打开 指定 文件 的 所 有 进程 

lsof -a 表示 两 个 参数 都 必须 满足 时 才 显示 结果 

lsof -c string 显示 COMMAND 列 中 包含 指定 字符 的 进程 所 有 打开 的 文件 
lsof -u username 显示 所 属 uUser 进 程 打 开 的 文件 

lsof -g gid 显示 归属 gid 的 进程 情况 

lsof +d /DIR/ 显示 目录 下 被 进程 打开 的 文件 

lsof +D /DIR/ 同上 ， 但 是 会 搜索 目录 下 的 所 有 目录 ， 时 间 相 对 较 长 
lsof -d FD 显示 指定 文件 描述 符 的 进程 

lsof -n 不 将 ITP 转 换 为 hostname， 缺 省 是 不 加 上 -n 参 数 

lsof -i 用 以 显示 符合 条 件 的 进程 情况 











(4) 常用 命令 如 下 所 述 。 























1) 查看 6666 端 口 现在 运行 情况 ， 命 令 : lsof-i: 6666， 结 果 如 图 8-7 所 示 。 








[ 








[rootûlinux ~]# 
COMMAND PID [s 1 | DEVICE SIZE/OFF NODE NAME 


server 29862 sharexu 3u IPv4 585165 OtO TCP *:ircu-2 (LISTEN) 


[root 81inux SE: p 





图 8-7 ”执行 lsofi: 6666 命 令 结果 图 

















2) 查看 所 属 root 用 户 进程 所 打开 的 文件 ， 文 件 类 型 为 .txt: lsof-a-u root-d txt， 结 果 如 图 8-8 所 示 。 























[root@linux ~]# lsof -a -u root -d txt 
COMMAND PID USER D TYPE DEVICE / NODE NAME 
init E O X REG 202,1 1302556 /sbin/init 


kthreadd 2 unknown /proc/2/exe 
migration 3 unknown /proc/3/exe 
ksoftirqd 4 /proc/4/exe 
migration 5 i 





图 8-8 ”执行 lsofa-u root-d txt 命 令 结 果 图 



































3) 监控 打开 的 文件 和 设备 。 查 看 设备 /dev/tty1 被 哪些 进程 占用 的 命令 是 : lsof/dev/tty1， 结 果 如 图 8-9 所 示 。 


[root@linux ~]# lsof /dev/ttyl 

COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME 
mingetty 1192 root Du CHR ot0 5063 /dev/ttyl 
mingetty 1192 root lu CHR 1 oto /dev/ttyl 
mingetty 1192 root 2u CHR 1 0tO0 5063 /dev/ttyl 





图 8-9 ”执行 lsof/dev/tty1 命 令 结果 图 





4) 监控 程序 。 如 查看 指定 程序 server 打 开 的 文件 : lsof-c server， 结 果 如 图 8-10 所 示 。 











server 
TYPE 


irpte r06/0605 


ter06/060 


(LISTEN) 








8-10 执行 lsof-c server 命 令 结果 图 





























5) 监控 用 户 。 比 如 查看 指定 用 户 sharexu 打 开 的 文件 : lsof-u sharexu， 结 果 如 图 8-11 所 示 。 






































NODE NAME 


DEL 
mem 
mem 








8-11 执行 lsof-u sharexu 命 令 结 果 图 











本 章 主要 介绍 了 ping、tcpdump、netstat 和 ]sof 这 4 个 工具 的 常用 用 法 ， 可 以 帮助 分 析 网 络 情况 。 


接 下 来 的 第 9 章 主要 讲 另 外 一 个 提高 服务 器 处 理 能 力 的 方法 : 多 线程 。 对 多 线程 概念 的 掌握 和 理解 水 平 ， 也 常 被 认为 是 衡量 一 个 人 的 编程 实力 的 重要 参考 指标 。 


为 了 更 好 地 理解 多 线程 的 概念 ， 先 对 进程 、 线 程 的 概念 背景 做 一 下 简单 介绍 。 早 期 的 计算 机 系统 都 只 允许 一 个 程序 独占 系统 资源 ， 一 次 只 能 执行 一 个 程序 。 在 大 型 机 年 代 ， 计 算 能 力 是 一 种 宝贵 资源 ， 
对 于 资源 拥有 方 来 说 ， 最 好 的 生财 之 道 自然 是 将 同一 资源 同时 租 售 给 尽 可 能 多 的 用 户 。 最 理想 的 情况 是 垄断 全 球 计算 市 场 ， 以 至 于 当年 LIBM 都 预测 “全 球 只 要 有 4 人 台 计 算 机 就 够 了 ” 


这 种 背景 下 ， 一 台 计 算 机 能 够 支持 多 个 程序 并 发 执行 的 需求 变 得 十 分 迫切 ， 由 此 产生 了 进程 的 概念 。 进 程 在 多 数 早期 多 任务 操作 系统 中 是 执行 工作 的 基本 单元 。 进 程 是 包含 程序 指令 和 相关 资源 的 集 
合 ， 每 个 进程 和 其 他 进程 一 起 参与 调度 ， 竟 争 CPU、 内 存 等 系统 资源 。 每 次 进程 切换 ， 都 存在 进程 资源 的 保存 和 恢复 动作 ， 这 称 为 上 下 文 切换 。 进 程 的 引入 可 以 解决 多 用 户 支持 的 问题 ， 但 是 多 进程 系统 也 
在 如 下 方面 产生 了 新 的 问题 : 进程 频繁 切换 引起 的 额外 开销 可 能 会 严重 影响 系统 性 能 。 进 程 间 通信 要 求 复杂 的 系统 级 实现 。 在 程序 功能 日 趋 复杂 的 情况 下 ， 上 述 缺 陷 也 就 凸显 出 来 。 


比如 ， 一 个 简单 的 GUI 程序 ， 为 了 有 更 好 的 交互 性 ， 通 常用 一 个 任务 支持 界面 交互 ， 另 一 个 任务 支持 后 台 运 算 。 如 果 每 个 任务 均 由 一 个 进程 来 实现 ， 那 会 相当 低 效 ， 但 对 每 个 进程 来 说 ， 系 统 资源 看 上 
去 都 是 其 独占 的 ， 比 如 内 存 空 间 ， 每 个 进程 都 认为 自己 的 内 存 空 间 是 独 有 的 。 每 一 次 切换 ， 这 些 独 立 资源 都 需要 切换 。 由 此 就 演化 出 了 利用 分 配给 同一 个 进程 的 资源 ， 尽 量 实现 多 个 任务 的 方法 ， 这 也 就 引 
入 了 线程 的 概念 。 

同一 个 进程 内 部 的 多 个 线程 ， 共 享 的 是 同一 个 进程 的 所 有 资源 。 比 如 ， 与 每 个 进程 独 有 自己 的 内 存 空间 不 同 ， 同 属 一 个 进程 的 多 个 线程 共享 该 进程 的 内 存 空 间 。 例 如 在 进程 地 址 空间 中 有 一 个 全 局 变量 
GlobalVar， 若 A 线程 将 其 赋值 为 1， 则 另 一 线程 B 可 以 看 到 该 变量 值 为 !， 但 两 个 线程 看 到 的 全 局 变量 GlobalVar 本 质 是 同一 个 变量 。 通 过 线程 可 以 支持 同一 个 应 用 程序 内 部 的 并 发 ， 免 去 了 进程 频繁 切换 的 开 
销 ， 另 外 并 发 任务 间 通 信也 更 简单 。 

网 络 程序 具有 天 生 的 并 发 性 ， 比 如 网 络 数 据 库 可 能 需要 同时 处 理 数 以 千 计 的 请 求 。 而 由 于 网 络 连 接 的 时 延 具有 不 确定 性 和 不 可 靠 性 ， 一 旦 等 待 一 次 网 络 交 互 时 ， 可 以 让 当前 线程 进入 睡眠 ， 退 出 调度 
而 去 处 理 其 他 线程 。 这 样 就 能 够 有 效 利用 系统 资源 ， 充 分 发 挥 系统 实时 处 理 能 力 。 线 程 的 切换 是 轻 量 级 的 ， 所 以 可 以 保证 足够 快 。 每 当 有 事件 发 生 状 态 改变 ， 都 能 有 线程 及 时 响应 ， 而 且 每 次 线程 内 部 处 理 
的 计算 强度 和 复杂 度 都 不 大 。 在 这 种 情况 下 ， 多 线程 实现 的 模型 也 是 高 效 的 。 


9.1 多 线程 是 什么 

















一 个 程序 的 运行 过 程 中 ， 只 有 一 个 控制 权 的 存在 。 当 函数 被 调用 的 时 候 ， 该 函数 获得 控制 权 ， 成 为 激活 (active) 函数 ， 然 后 运行 该 函数 中 的 指令 。 与 此 同时 ， 其 他 的 函数 处 于 离 场 状态 ， 并 不 运行 ， 
如 图 9-1 所 示 。 





























9-1 中 ， 各 个 方块 之 间 由 箭头 连接 ， 而 各 个 函数 就 像 是 连 在 一 根 线 上 一 样 ， 计 算 机 像 一 条 流水 线 一 样 执行 各 个 函数 中 定义 的 操作 。 这 样 的 一 个 程序 叫做 单线 程 程序 。 








D 








多 线程 就 是 允许 一 个 进程 内 存在 多 个 控制 权 ， 以 便 让 多 个 函数 同时 处 于 激活 状态 ， 从 而 让 多 个 函数 的 操作 同时 运行 。 即 使 是 单 核 CPU 的 计算 机 ， 也 可 以 通过 不 停 地 在 不 同 线程 的 指令 间 切 换 ， 从 而 造成 
多 线程 同时 运行 的 效果 。 图 9-2 所 示 为 一 个 多 线程 的 流程 图 。 


























main inner 


Main 
Main2 
Callinner() 






Range of glob 





图 9-2 ”多 线程 流程 示意 图 


end 


main () 到 func3 () 再 到 main () 构成 一 个 线程 ， 此 外 func1 () 和 func2 () 构成 另外 两 个 线程 。 操 作 系统 一 般 都 有 一 些 系统 调用 来 让 一 个 函数 运行 成 为 一 个 新 的 线程 。 


回忆 下 栈 的 功能 和 用 途 : 一 个 栈 中 只 有 最 下 方 的 帧 可 被 读 写 ， 相 应 的 ， 也 只 有 该 帧 对 应 的 那个 函数 被 激活 ， 处 于 工作 状态 。 为 了 实现 多 线程 ， 则 必须 绕 开 栈 的 限制 。 为 此 ， 在 创建 一 个 新 的 线程 时 ， 需 
要 为 这 个 线程 建 一 个 新 的 栈 ， 每 个 栈 对 应 一 个 线程 。 当 某 个 栈 执行 到 全 部 弹出 时 ， 对 应 线程 完成 任务 ， 并 结束 。 所 以 ， 多 线程 的 进程 在 内 存 中 有 多 个 栈 ， 多 个 栈 之 间 以 一 定 的 空白 


长 。 每 个 线程 可 调用 自己 栈 最 下 方 的 帧 中 的 参数 和 变量 ， 并 与 其 他 线程 共享 内 存 中 的 Text、heap 和 global data 区 域 。 对 应 上 面 








图 9-2 的 例子 ， 这 里 的 进程 空间 中 需要 有 3 个 栈 。 





要 注意 的 是 ， 对 于 多 线程 来 说 ， 由 于 同一 个 进程 空间 中 存在 多 个 栈 ， 任 何 一 个 空白 区 域 被 填 满 都 会 导致 栈 溢出 。 





这 就 是 多 线程 ， 与 栈 密切 相关 。 


9.2 ”多 线程 的 创建 与 结束 


1 .线程 的 创建 





区 域 隔 开 ， 以 备 栈 的 增 


多 线程 函数 需要 包括 的 头 文件 : 





#include<pthread.h> 





线程 创建 函数 : pthread create， 它 的 函数 原型 是 : 





int pthread create(pthread t *thread, const pthread attr t *attr, void *(*start routine) (void *), void *arg); 





这 里 看 到 一 种 新 的 数据 类 型 pthread t, pthread t 的 定义 是 typedef unsigned long int pthread t。 也 就 是 说 ，pthread t 其 实 是 unsigned long int 来 的 ， 是 个 无 符号 的 长 整 型 。 

















pthread create 函 数 第 一 个 参数 为 指向 线程 标识 符 的 指针 ， 第 二 个 参数 用 来 设置 线程 属性 ， 第 三 个 参数 是 线程 运行 函数 的 起 始 地 址 ， 最 后 一 个 参数 是 运行 函数 的 参数 。 























pthread create 函数 的 返回 值 : 若 线程 创建 成 功 ， 则 返回 0， 若 线程 创建 失败 ， 则 返回 出 错 编号 ， 并 且 *thread 中 的 内 容 是 未 定义 的 。 返 回 成 功 时 ， 由 thread 指 向 的 内 存单 元 将 被 设置 为 新 创建 线程 的 线 


程 ID。attr 参 数 用 于 指定 各 种 不 同 的 线程 属性 。 新 创建 的 线程 从 start_routine 函 数 的 地 址 : 























参数 放 到 同一 个 结构 中 ， 然 后 把 这 个 结构 的 地 址 作为 arg 的 参数 传 入 。 








pthread join 函数 用 来 等 待 一 个 线程 的 结束 ， 其 函数 原型 为 : 

















int pthread join (pthread t thread, void **retval) 


始 运行 ， 该 函数 只 有 一 个 万 能 指针 参数 arg， 如 果 需 要 向 start_routine 函 数 传递 的 参数 不 止 一 个 ， 那 么 需要 把 这 些 

















第 一 个 参数 为 被 等 待 的 线程 标识 符 ， 第 二 个 参数 为 一 个 
当 函 数 返 回 时 ， 被 等 待 线程 的 资源 被 收回 。 


























户 定义 的 指针 ， 它 可 以 用 来 存储 被 等 待 线程 的 返回 值 。 这 个 函数 是 一 个 线程 阻塞 的 函数 ， 调 用 它 的 函数 将 一 直 等 待 到 被 等 待 的 线程 结束 为 止 ， 





pthread_exit 函 数 ， 一 个 线程 的 结束 有 两 种 途径 : 函数 已 经 结束 ， 调 用 它 的 线程 也 就 结束 了 ; @ 通 过 函数 pthread_exit 来 实现 。 它 的 函数 原型 为 : 





void pthread exit (void *retval); 





其 中 ， 唯 一 的 参数 是 函数 的 返回 代码 。 





pthread join 和 pthread_exit 的 区 别 如 下 所 述 。 








(1) pthread join 一 般 是 主线 程 来 调 有 




















用 来 等 待 子 线程 退出 ， 因 为 是 等 待 ， 所 以 是 阻塞 的 ， 一 般 主线 程 会 依次 添加 所 有 它 创 建 的 子 线程 。 











(2) pthread_exit 一 般 是 子 线程 调用 ， 用 来 结束 当前 线程 。 














(3) 子 线程 可 以 通过 pthread_exit 传 递 一 个 返回 值 ， 而 主线 程 通过 pthread _join 获 得 该 返回 值 ， 从 而 判断 该 子 线程 的 退出 是 正常 还 是 异常 。 





下 面 例 9.1 讲 述 了 线程 的 创建 与 结束 。 


【 例 9.1】 ”线程 的 创建 与 结束 。 


#include <stdio.h> 

#include «pthread.h» 

void* say hello(void* args){ 
/* 线 程 的 运行 函数 ， 必 须 Void*， 没 说 的 表示 返回 通用 指针 
printf ("hello from thread\n"); 
pthread exit ((void*)1); 


int main(){ 
pthread t tid; 


、 输 入 通用 指针 */ 


int iRet = pthread create(&tid, NULL, say hello, NULL); 
/* 参 数 依次 是 : 创建 的 线程 da， 线程 参数 ， 调 用 函数 名 ， 传 入 的 函数 参数 */ 


if (iRet){ 


printf ("pthread create error: iRet-$dWn",iRet); 


return iRet; 
} 
void *retval; 
iRet=pthread_join (tid, &retval); 
if (iRet){ 


printf ("pthread join error: iRet=%d\n", iRet); 


return iRet; 
} 
printf ("retval-$1dWn", (long) retval); 
return 0; 








编译 程序 的 命令 是 : g++-lpthread-o test test.cpp， 这 里 需要 连接 静态 库 文 件 pthread。 执 行 ./test 命 令 可 得 到 : 





hello from thread 
temp-1 





例 9.1 中 ，say_hello 函 数 是 线程 的 运行 函数 ， 返 回 值 是 void* 类 型 ， 也 就 是 返回 通 

































































指针 、 输 入 通用 指针 。 在 线程 函数 中 调用 pthread_exit， 以 便 返 回 值 被 主线 程 接收 ， 如 下 所 示 。 








void* say hello(void* args){ 


/* 线 程 的 运行 函数 ， 必 须 Void*， 没 说 的 表示 返回 通用 指针 、 输 入 通用 指针 */ 


printf ("hello from thread\n"); 
pthread exit ((void*)1); 
} 





创建 线程 ， 参 数 依次 是 : 创建 的 线程 id、 线 程 参数 、 调 用 函数 名 、 传 入 的 函数 参数 。 这 号 





里 ， 线 程 的 id 放 在 变量 tid 里 ， 线 程 参数 和 函数 参数 都 为 空 ， 函 数 名 是 say_hello。 





int iRet = pthread create(&tid, NULL, say hello, NULL); 

















调用 pthread join 函数 ， 获 取 线 程 的 返回 值 。 注 意 ， 由 了 














p 


void *retval; 

iRet-pthread join (tid, &retval); 

if (iRet){ ~ 
printf("pthread join error: iRet=%d\n",iRet); 
return iRet; T 


} 
printf ("retval=%ld\n", (long) retval); 


本 程序 是 在 64 位 机 器 上 执行 的 ， 所 以 指针 类 型 和 long 类 型 大 小 相等 ， 都 是 8Byte， 并 

















将 temp 强 制 转换 成 了 long 类 型 。 如 果 强 制 转 换 成 int 类 





编译 时 会 提示 “error: cast from'void*'to'int'loses precision" ， 即 丢失 精度 。 











在 例 9.1 的 基础 上 ， 如 果 线程 调用 的 函数 是 在 一 个 类 中 时 ， 应 该 把 该 函数 写成 静态 成 员 函 数 ， 如 例 9.2 所 示 。 














【 例 9.2】 ”创建 线程 时 传 入 类 的 成 员 函 数 。 





#include <stdio.h> 
#include «pthread.h» 
class Hello( 
public: 
static void* say hello(void* args)í 
/* 线 程 的 运行 函数 ， 必 须 Void* ， 没 说 的 表示 返回 通用 指针 、 输 入 通用 指针 */ 
printf("hello from threadWn"); 
pthread exit ((void*)1); 
} 
l; 
int main (){ 
pthread t tid; 
int iRet = pthread create(&tid, NULL, Hello::say hello, NULL); 
/* 参 数 依次 是 : 创建 的 线程 id， 线程 参数 ， 调 用 函数 名 ， 传 入 的 函数 参数 */ 
if (iRet){ 
printf ("pthread create error: iRet-$dW",iRet); 
return iRet; ` 


void *retval; 

iRet-pthread join (tid, &retval); 

if (iRet)( 
printf ("pthread join error: iRet-$dWn",iRet); 
return iRet; 

l 

printf ("retval-$1dWMn", (long) retval); 

return 0; 





程序 的 执行 结果 是 : 





hello from thread 
temp-1 





例 9.2 与 例 9.1 相 比 ， 就 是 把 函数 say_hello 换 成 了 类 中 的 静态 成 员 函 数 ， 程 序 的 输出 结果 是 一 样 的 。 


2. 向 线程 传递 参数 











线程 创建 完成 后 ， 那 如 何在 线程 调用 函数 时 传 入 参数 呢 ? 如 例 9.3 所 示 。 











【 例 9.3】 ”在 线程 调用 函数 时 传 入 int 类 型 的 参数 。 

















#include <stdio.h> 

#include «pthread.h» 

void* say hello(void* args)í 
int i-* (int*)args; 
printf("hello from thread, i=%d\n", i); 
pthread exit ((void*)1); 


int main (){ 
pthread t tid; 
int para=10; 
int iRet = pthread create (&tid, NULL, say hello, &para); 
if (iRet){ 
printf ("pthread create error: iRet-$dWn",iRet); 
return iRet; 


void *retval; 

iRet-pthread join (tid, &retval); 

if (iRet)( 
printf("pthread join error: iRet-$dW",iRet); 
return iRet; ` 

} 

printf ("retval=%ld\n", (long) retval); 

return 0; 





程序 的 执行 结果 : 





hello from thread,i-10 
retval=1 











例 9.3 中 ， 给 线程 调用 的 函数 传递 了 一 个 int 类 型 的 参数 para， 值 是 10， 代 码 如 下 所 示 。 

















int para-10; 
int iRet = pthread create(&tid, NULL, say hello, &para); 
if (iRet)( 
printf ("pthread create error: iRet-$dWn",iRet); 
return iRet; 





并 在 函数 中 把 参数 给 打印 出 来 ， 代 码 如 下 所 示 。 





void* say hello(void* args)( 
int i-* (int*)args; 
printf ("hello from thread, i=%d\n", i); 
pthread exit ((void*)1); 





pthread create (&tid, &attr, &func, (void) arg) ; 看 起 来 只 能 传递 一 个 参数 给 func， 如 果 要 传 一 个 以 上 的 参数 呢 ， 则 应 该 把 它们 放 到 一 个 结构 体 里 ， 然 后 传递 这 个 结构 体 ， 可 参见 例 9.4。 




















【 例 9.4】 在 线程 调用 函数 时 传 入 一 个 结构 体 。 





finclude <stdio.h> 

#include «pthread.h» 

#include <string.h> 

struct arg_type{ 
int a; 
char b[100]; 

H 

void* say hello(void* args){ 
arg type arg temp-* (arg type*)args; 
printf("hello from thread,arg temp.a-$d, arg temp.b-$sWn",arg temp.a,arg temp.b); 
pthread exit ((void*)1); 

l 


int main()( 


pthread t tid; 

arg type arg temp; 

arg temp.a-10; 

char temp[100]-"I am number one."; 

strncpy (arg temp.b, temp, sizeof (temp)); 

int iRet = pthread create(&tid, NULL, say hello, &arg temp); 

if (iRet)( T T = 
printf ("pthread create error: iRet-$dW",iRet); 
return iRet; É 

l 

void *retval; 

iRet-pthread join (tid, &retval); 

if (üRet)( 
printf ("pthread join error: iRet-£dWMn",iRet); 
return iRet; 

l 

printf ("retval-$1dWn", (long) retval); 

return 0; 





程序 的 执行 结果 如 








9-3 所 示 。 


D 
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图 9-3 ” 例 9.4 中 程序 的 执行 结果 




















例 9.4 中 ,向 pthread_ create 中 调用 的 函数 say_hello 传 入 了 一 个 结 结构 体 ， 传 入 时 直接 引用 结构 体 的 地 址 即 可 ， 代 码 如 下 所 示 。 





arg type arg temp; 

arg temp.a-10; 

char temp[100]-"I am number one."; 

strncpy(arg temp.b,temp, sizeof (temp) ); 

int iRet = pthread create (&tid, NULL, say hello, &arg temp); 


3. 获 得 线程 id 
我 们 有 两 种 方式 可 以 打印 线程 的 id: @ 在 线程 调用 函数 中 使 用 pthread _self 函 数 来 获得 线程 id，@ 在 创建 函数 时 生成 的 jd。 我 们 来 分 别 实现 一 下 这 两 个 方法 ， 来 判断 结果 是 否 一 致 ， 参 见 例 9.6。 


【 例 9.6】 ”获得 线程 的 id。 


#include<stdio.h> 

#include<pthread.h> 

void *function(void *arg){ 
printf ("thread id in pthread-$luWn", pthread self()); 
pthread exit((void *)1); 


int main(){ 
int i-10; 
pthread t thread; 
int iRet = pthread create(&thread, NULL, &function, &i); 
if (iRet) { 
printf ("pthread create error, iRet=%d\n",iRet); 
return iRet; il 


printf ("thread id in process-$1uW", thread); 

void *retval; 

iRet-pthread join(thread, &retval); 

if (iRet) { 
printf ("pthread join error, iRet-$dWM",iRet); 
return iRet; Es 

} 

printf ("retval=%ld\n", (long*) retval); 

return 0; 





程序 的 执行 结果 如 图 9-4 所 示 。 
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图 9-4 例 9.6 中 程序 的 执行 结果 




















可 见 ， 用 pthread _ create 创建 的 线程 id 和 用 pthread _self 函 数 获 得 的 线程 id 是 一 样 的 。 














9.3 ”线程 的 属性 
































线程 有 一 组 属性 是 可 以 在 线程 被 创建 时 指定 的 。 该 组 属性 被 封装 在 一 个 对 象 中 ， 该 对 象 可 用 来 设置 一 个 或 一 组 线程 的 属性 。 线 程 属性 对 象 的 类 型 为 pthread_attr t, pthread attr t 包 含 在 pthread.h 头 
文件 中 。 








线程 属性 结构 如 下 所 示 。 


typedef struct 
{ 


int etachstate; // 线程 的 分 离 状态 

int schedpolicy; // 线程 调度 策略 
structsched param schedparam; // 线程 的 调度 参数 

int inheritsched; // 线程 的 继承 性 

int scope; // 线程 的 作用 域 

size t guardsize; // 线程 栈 末 尾 的 警戒 缓冲 区 大 小 
int Stackaddr set; // 线程 的 栈 设 置 

void* stackaddr; // 线程 栈 的 位 置 


size t stacksize; // 线程 栈 的 大 小 
]pthread attr t; 
























































属性 值 不 能 直接 设置 ， 必 须 使 用 相关 函数 进行 操作 ， 初 始 化 的 函数 为 pthread_attr_init， 且 这 个 函数 必须 在 pthread_create 函 数 之 前 调用 ， 之 后 必须 用 pthread_attr_destroy 函 数 来 释放 资源 。 线 程 属 
性 主要 包括 如 下 属性 : 作用 域 (scope) 、 栈 尺寸 (stack size) 、 栈 地 址 (stack address) 、 优 先 级 (priority) 、 分 离 的 状态 (detached state) 、 调 度 策略 和 参数 (scheduling policy and 
parameters) 等 。 默 认 的 属性 为 非 绑 定 、 非 分 离 、 默 认 1MB 大 小 的 堆栈 、 与 父 进 程 同样 级 别 的 优先 级 。 





























POSIX.1 指 定 了 一 系列 方法 获取 和 设置 pthread_attr t 结 构 里 面 的 各 个 属性 ， 如 下 所 述 。 

















(1) 分 离 状态 (detached state) : 若 线程 终止 时 ， 线 程 处 于 分 离 状 态 ， 系 统 将 不 保留 线程 终止 的 状态 ; 当 不 需要 线程 的 终止 状态 时 ， 可 以 分 离线 程 (调用 pthread_detach 函 数 ) ; 若 在 线程 创建 的 
时 候 ， 就 已 经 知道 以 后 不 需要 使 用 线程 的 终止 状态 ， 可 以 在 线程 创建 属性 里 面 指定 该 状态 ， 那 么 线程 一 开始 就 处 于 分 离 状 态 。 通 过 下 面 两 个 函数 ， 设 置 和 获取 线程 的 分 离 属性 : 





















































int pthread attr getdetachstate ( const pthread attr t *attr, int *state ); 
int pthread attr setdetachstate ( pthread attr t *attr, int state ); 


该 属性 的 可 选 值 有 : PTHREAD CREATE DETACHED, PTHREAD CREATE JOINABLE, 








(2) 栈 地 址 (stack address) : POSIX.1 定 义 了 两 个 常量 POSIX THREAD_ATTR_STACKADDR 和 POSIX THREAD _ATTR_STACKSIZE 以 检测 系统 是 否 支持 栈 属性 。 当 然 也 可 以 给 sysconf 函 数 传递 
_SC_THREAD_ATTR_STACKADDR 或 SC_THREAD_ATTR_STACKSIZE 来 进行 检测 。 当 进程 栈 地 址 空间 不 够 用 时 ， 指 定 新 建 线程 使 用 由 malloc 分 配 的 空间 作为 自己 的 栈 空间 。 通 过 
pthread attr_setstackaddr 和 pthread_attr_getstackaddr 两 个 函数 分 别 设置 和 获取 线程 的 栈 地 址 。 传 给 pthread_attr_setstackaddr 函 数 的 地 址 是 缓冲 区 的 低地 址 (不 一 定 是 栈 的 开始 地 址 ， 栈 可 能 从 高 地 
址 往 低地 址 增长 ) ， 代 码 如 下 所 示 。 























int pthread attr getstackaddr ( const pthread attr t *attr, void **addr ); 
int pthread attr setstackaddr ( pthread attr t *attr, void *addr ); 


























(3) 栈 大 小 (stack size) : 当 系 统 中 有 很 多 线程 时 ， 可 能 需要 减 小 每 个 线程 栈 的 默认 大 小 ， 防 止 进程 的 地 址 空间 不 够 用 ;， 当 线程 调用 的 函数 会 分 配 很 大 的 局 部 变量 或 者 函数 调用 层次 很 深 时 ， 可 能 需 
要 增 大 线程 栈 的 默认 大 小 。 函 数 pthread_attr_getstacksize 和 pthread_attr_setstacksize 被 提供 来 解决 这 个 问题 。 
































int pthread attr getstacksize ( const pthread attr t *attr, size 七 *size ); 
int pthread attr setstacksize ( pthread attr t *attr, size t size ); 








函数 pthread attr getstackfüpthread _attr_setstack 函 数 可 以 同时 操作 栈 地 址 和 栈 大 小 两 个 属性 ， 代 码 如 下 所 示 。 





int pthread attr getstack ( const pthread attr t *attr, void **stackaddr, size t *size ); 
int pthread attr setstack ( pthread attr t *attr, void *stackaddr, size t size D; 








(4) 栈 保护 区 大 小 (stack guard size) : 在 线程 栈 顶 留 出 一 段 空 间 ， 防 止 栈 溢出 。 当 栈 指针 进入 这 段 保护 区 时 ， 系 统 会 发 出 错误 提示 ， 通 常会 发 送信 号 给 线程 。 该 属性 默认 值 是 PAGESIZE 的 大 小 ， 
该 属性 被 设置 时 ， 系 统 会 自动 将 该 属性 大 小 补 齐 为 页 大 小 的 整数 倍 。 当 改变 栈 地 址 属性 时 ， 栈 保护 区 大 小 通常 清 零 。 




















int pthread attr getguardsize ( const pthread attr t *attr, size t *guardsize ); 
int pthread attr setguardsize ( pthread attr t *attr, size t guardsize ); 





(5) 线程 优先 级 (priority) : 新 线程 的 优先 级 为 0。 





int pthread attr getschedparam(const pthread attr t *restrict attr, struct sched param *restrict param); 
int pthread attr setschedparam(pthread attr t *restrict attr, const struct sched param *restrict param); 





(6) 继承 父 进程 优先 级 (inheritsched) : 新 线程 不 继承 父 线程 调度 优先 级 。 








(7) 调度 策略 (schedpolicy) : 新 线程 使 用 SCHED_OTHER 调 度 策略 。 线 程 一 旦 开始 运行 ， 直 到 被 抢占 或 者 直到 线程 阻塞 或 停止 为 止 。 




















int pthread attr setschedpolicy (pthread attr t* attr, int policy) 
int pthread attr setschedparam (pthread attr t* attr, struct sched param* param); 
























































(8) 争 用 范围 (scope) : 建立 线程 的 争 用 范围 (PTHREAD SCOPE SYSTEMBEPTHREAD SCOPE PROCESS) 。 使 用 PTHREAD_SCOPE_SYSTEM 时 ， 此 线程 将 与 系统 中 的 所 有 线程 进行 竞争 。 使 
PTHREAD_SCOPE_PROCESS 时 ， 此 线程 将 与 进程 中 的 其 他 线程 进行 竞争 ， 又 称 为 绑 定 状态 ，PTHREAD_SCOPE_SYSTEM ( 绑 定 的 ) 和 PTHREAD_SCOPE_PROCESS ( 非 绑 定 的 ) 。 具 有 不 同 范围 状态 的 
线程 可 以 在 同一 个 系统 甚至 同一 个 进程 中 共存 。 进 程 范围 只 允许 这 种 线程 与 同一 进程 中 的 其 他 线程 争 用 资源 ， 而 系统 范围 则 允许 此 类 线程 与 系统 内 的 其 他 所 有 线程 争 用 资源 。 实 际 上 ， 从 Solaris 9 发 行 版 开 
始 ， 系 统 就 不 再 区 分 这 两 个 范围 。 











































































































int Pthread_attr_getscope (const pthread attr t *restrict attr, int *restrict contentionscope); 
int pthread attr setscope (pthread attr t *attr, int contentionscope); 























(9) 线程 并 行 级 别 (concurrency) 应 用 程序 使 用 pthread_setconcurrency () 通知 系统 其 








所 需 的 并 发 级 别 。 


























int pthread getconcurrency (void); 
int pthread setconcurrency (int new level); 


























POSIX 标 准 指定 了 3 种 调度 策略 : 先入 先 出 策略 (SCHED FIFO) 、 循 环 策略 (SCHED RR) 和 自 定义 策略 (SCHED OTHER) 。SCHED_FIFO 是 基于 队列 的 调度 程序 ， 对 于 每 个 优先 级 都 会 使 用 不 同 的 
队列 。SCHED_RR 与 FIFO 相 似 ， 不 同 的 是 前 者 的 每 个 线程 都 有 一 个 执行 时 间 配额 。 



































SCHED FIFO: 如 果 调用 进程 具有 有 效 的 用 户 ID 为 0， 则 争 用 范围 为 系统 (PTHREAD SCOPE SYSTEM) 的 先入 先 出 线程 属于 实时 (RT) 调度 类 。 如 果 这 些 线程 未 被 优先 级 更 高 的 线程 抢占 ， 则 会 继续 
处 理 该 线程 ， 直 到 该 线程 放弃 或 阻塞 为 止 。 对 于 具有 进程 争 用 范围 (PTHREAD SCOPE PROCESS) 的 线程 或 其 调用 进程 没有 有 效用 户 I|D 为 0 的 线程 ， 请 使 用 SCHED_FIFO。SCHED_FIFO 基 于 TS 调度 类 。 






























































































































































SCHED RR: 如 果 调 用 进程 具有 有 效 的 用 户 ID 0， 则 争 用 范围 为 系统 (PTHREAD SCOPE SYSTEM) 的 循环 线程 ， 属 于 实时 (RT) 调度 类 。 如 果 这 些 线程 未 被 优先 级 更 高 的 线程 抢占 ， 并 且 这 些 线程 
没有 放弃 或 阻塞 ， 则 在 系统 确定 的 时 间 段 内 将 一 直 执行 这 些 线程 。 对 于 具有 进程 争 用 范围 (PTHREAD SCOPE PROCESS) 的 线程 ， 请 使 用 SCHED_RR (基于 TS 调度 类 ) 。 此 外 ， 这 些 线程 的 调用 进程 没 
有 效 的 用 户 ID 0。 































































































将 线程 设置 为 结束 状态 分 离 后 ， 线 程 的 结束 状态 将 不 能 被 进程 中 的 其 他 线程 得 到 ， 同 时 保存 线程 结束 状态 的 存储 区 域 也 将 变 得 不 能 应 用 。 下 面 的 例 9.7 演 示 了 如 何 分 离 出 一 个 线程 。 





T 








【 例 9.7】 分离 一 个 线程 。 





#include <stdio.h> 

#include <stdlib.h> 

#include <pthread.h> 

#include <string.h> 

void * 七 fnl (void * arg) { 
printf ("the thread\n"); 
return NULL; 


int main (void) { 

int iRet; 

pthread t tid; 

pthread attr t attr; 

iRet = pthread attr init(&attr); 

if (iRet) { 
printf ("can't init attr $s/n", strerror (iRet)); 
return iRet; 

} 

iRet = pthread attr setdetachstate (&attr, PTHREAD CREATE DETACHED); 

if (iRet) { 
printf ("can't set attr %s\n", strerror (iRet)); 
return iRet; 

} 

iRet = pthread create(&tid, &attr, tfnl, NULL); 

if (iRet) { E 
printf ("can't create thread $sWMn", strerror(iRet)); 
return iRet; 

} 

iRet = pthread join(tid, NULL); 

if (iRet) { T 
printf ("thread has been detachedWn"); 
return iRet; 

} 


return 0; 








程序 的 执行 结果 如 图 9-5 所 示 。 
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图 9-5 例 9.7 中 程序 的 执行 结果 








例 9.7 中 ， 把 线程 的 属性 设置 为 了 线程 与 线程 结束 状态 分 离 ， 代 码 如 下 : 





iRet = pthread attr setdetachstate (&attr, PTHREAD CREATE DETACHED); 








创建 一 个 线程 时 ， 带 上 这 个 属性 ， 代 码 如 下 : 





iRet = pthread create(&tid, &attr, tfnl, NULL); 








由 于 状态 分 离 ， 因 此 得 不 到 线程 的 结束 状态 信息 ，pthread join 函数 会 出 错 ， 代 码 如 下 : 





iRet = pthread join(tid, NULL); 
if (iRet) { 
printf ("thread has been detachedWn"); 
return iRet; 





由 程序 的 执行 结果 显示 ， 该 线程 已 成 功 分 离 。 











例 9.7 中 我 们 是 在 线程 创建 之 前 ， 就 将 它 的 属性 设置 为 分 离 状 态 。 下 面 的 例 9.8 演 示 了 如 何 分 离 一 个 已 经 创建 的 线程 。 





【 例 9.8】 ”分 离 一 个 已 经 创建 的 线程 。 


#include <stdio.h> 

#include <stdlib.h> 

#include <pthread.h> 

#include <string.h> 

#include <unistd.h> 

void * 七 fnl (void * arg) { 
printf ("the sub thread sleeping for 5 seconds\n"); 
sleep (5) ;/* 休 眠 5 秒 ， 等 待 主线 程 将 该 线程 设置 为 分 离 状 态 */ 
printf("the thread done\n"); 
return NULL; 


int main (void) { 

int iRet; 

pthread t tid; 

iRet = pthread create(&tid, NULL, tfnl, NULL); 

/* 创 建 一 个 线程 ， 这 个 线程 和 结束 状态 是 分 离 的 */ 

if (iRet) { 
printf ("can't create thread %s\n", strerror (iRet)); 
return iRet; 


} 
iRet = pthread detach (tid) ;/* 设 置 线程 为 分 离 状态 */ 
if (iRet) { 
printf ("can't detach thread %s\n", strerror (iRet)); 
return iRet; 
} 
iRet = pthread join (tid, NULL); 
/* 由 于 状态 分 离 ， 因 此 得 不 到 线程 的 结束 状态 信息 ， 此 函数 会 出 错 */ 
if (iRet) { 
printf ("thread has been detachedWn"); 
} 


printf("the main thread sleeping for 8 secondsWn"); 
sleep(8); 

printf("the main thread done. Mn"); 

return 0; 








程序 的 执行 结果 如 图 9-6 所 示 。 
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图 9-6 例 9.8 中 程序 的 执行 结果 



































例 9.8 中 ， 用 pthread_detach 函 数 将 一 个 已 创建 的 线程 设置 为 分 离 状态 ， 导 致 用 pthread join 函数 获取 不 到 它 的 结束 状态 信息 ， 代 码 如 下 : 











iRet = pthread detach (tid); 








9.4 ”多 线程 同步 


多 线程 相当 于 一 个 并 发 系统 ， 一 般 同时 执行 多 个 任务 。 如 果 多 个 任务 可 以 共享 资源 ， 特 别 是 同时 写 入 某 个 变量 的 时 候 ， 就 需 


1. 多 线程 同步 问题 














[459.9] 多 线程 来 模拟 火车 售票 系统 。 








#include<stdio.h> 
#include<pthread.h> 
#include<unistd.h> 
int total ticket num-20; 
void *sell ticket (void *arg)( 
for(int i=0;i<20;i++){ 
if(total ticket num»0)( 
sleep(1); 
printf("sell the $dth ticketin",20-total ticket numtl); 
total ticket num--; 


} 
return 0; 


int main(){ 
int iRet; 
pthread t tids[4]; 
int i-0; 
for (i=0;i<4; i++) { 
int iRet = pthread create(&tids[i], NULL, &sell ticket, NULL); 
if (iRet) { E M 
printf ("pthread create error, iRet-$dW",iRet); 
return iRet; 
} 
} 
sleep (20) 7 
void *retval; 
for (i=0;i<4;i++) { 
iRet-pthread join(tids[i], &retval); 
ifüRet)( ` 
printf("tid-$d join error, iRet-$dWn",tids[i],iRet); 
return iRet; 


} 
printf ("retval=%ld\n", (long*) retval); 


return 0; 





程序 的 执行 结果 如 图 9-7 所 示 。 























解决 同步 的 问题 。 这 里 





多 线程 来 模拟 火车 售票 系统 ， 具 体 代码 见 例 9.9。 





[sharexuglinux 69809]$ g++ -lpthread -o test test.cpp 
[sharexuglinux OGOO]£ ./test 
sall the ticket 
cell the ticket 
cell tha ticket 
cell the ticket 
cell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
sall the ticket 
sell the ticket 
cell the tickat 
cell the ticket 
cell the ticket 
sell the ticket 
sell the ticket 
sell the ticket 
retval-B 

retval-B 

retval-D 

retval-B 
[sharexuglinux 09091$ 
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图 9-7 例 9.9 中 程序 的 执行 结果 


程序 的 执行 结果 并 不 如 预期 所 想 ， 总 票数 只 有 20 张 ， 却 卖 掉 了 23 张 。 程 序 创建 了 4 个 线程 ， 每 个 线程 都 执行 卖 票 函数 。 总 票数 是 存放 在 一 个 全 局 变量 total ticket_num 里 的 ， 代 码 如 下 : 


total ticket num+1); 


} 
return 0; 


事实 上 ， 如 果 只 有 一 个 线程 执行 上 面 的 程序 的 时 候 (相当 于 一 个 窗口 售票 ) ， 则 没有 问题 。 但 如 果 多 个 线程 都 执行 上 面 的 程序 (相当 于 多 个 窗口 售票 ) ， 就 会 出 现 问题 。 其 根本 原因 在 于 同时 发 生 的 各 
个 线程 都 可 以 对 total ticket_num 读 取 和 写 入 。 

这 里 的 if 结构 会 判断 是 否 有 剩余 的 票 (total ticket num»0) ， 如 果 有 则 卖 票 (total_ticket num-total ticket num-1) 。 某 个 线程 会 先 判断 是 否 有 票 (比如 说 此 时 total_ ticket_num 为 1) ， 但 两 个 
指令 之 间 存 在 一 个 时 间 窗 口 ， 其 他 线程 可 能 在 此 时 间 窗 口内 执行 卖 票 操作 (total ticket num=total ticket num-1) ， 导 致 该 线程 卖 票 的 条 件 不 再 成 立 。 但 该 线程 由 于 已 经 执行 过 了 判断 指令 ， 所 以 无 从 知 
道 total_ticket_num 发 生 了 变化 ， 所 以 继续 执行 卖 票 指令 ， 以 至 于 卖 出 不 存在 的 票 (total_ticket_num 成 为 负数 ) 。 对 于 一 个 真实 的 售票 系统 来 说 ， 这 将 成 为 一 个 严重 的 错误 ( 售 出 了 过 多 的 票 ， 火 车 超 
RB. 

在 并 发 情况 下 ， 指 令 执行 的 先后 顺序 由 内 核 决 定 。 同 一 个 线程 内 部 ， 指 令 按照 先后 顺序 执行 ， 但 不 同 线程 之 间 的 指令 很 难说 清楚 哪 一 个 会 先 执行 。 如 果 运 行 的 结果 依赖 于 不 同 线程 执行 的 先后 的 话 ， 那 
么 就 会 造成 亮 争 条 件 ， 在 这 样 的 状况 下 ,计算机 的 结果 很 难 预 知 ， 所 以 应 该 尽量 避免 竞争 条 件 的 形成 。 最 常见 的 解决 竞争 条 件 的 方法 是 将 原先 分 离 的 两 个 指令 构成 不 可 分 割 的 一 个 原子 操作 ， 而 其 他 任务 不 





能 插入 到 原子 操作 中 。 





对 于 多 线程 程序 来 说 ， 同 步 是 指 在 一 定 的 时 间 内 只 允许 某 一 个 线程 访问 某 个 资源 。 而 在 此 时 间 内 ， 不 允许 其 他 的 线程 访问 该 资源 。 可 以 通过 互 斥 锁 (mutex) 、 条 件 变 量 (condition variable) 、 读 写 
$ (reader-writer lock) 和 信号 量 (semphore) 来 同步 资源 。 


2. 互 斥 锁 








互 斥 锁 是 一 个 特殊 的 变量 ， 它 有 锁 上 (lock) 和 打开 (unlock) 两 个 状态 。 互 斥 锁 一 般 被 设置 成 全 局 变量 。 打 开 的 互 斥 锁 可 以 由 某 个 线程 获得 。 一 旦 获得 ， 这 个 互 斥 锁 会 锁 上 ， 此 后 只 有 该 线程 有 权 打 
开 ， 其 他 想 要 获得 互 斥 锁 的 线程 ， 会 等 待 直到 互 斥 锁 再 次 打开 的 时 候 。 我 们 可 以 将 互 斥 锁 想 象 成 一 个 只 能 容纳 一 个 人 的 洗手 间 ， 当 某 个 人 进入 洗手 间 的 时 候 ， 可 以 从 里 面 将 洗手 间 锁 上 ， 其 他 人 只 能 在 互 斥 
锁 外 面 等 待 那个 人 出 来 ， 才 能 进去 。 但 在 外 面 等 候 的 人 并 没有 排队 ， 谁 先 看 到 洗手 间 空 了 ， 就 可 以 首先 冲 进去 。 





























上 面 的 问题 很 容易 使 用 互 斥 锁 的 问题 解决 ， 程 序 可 以 改 为 这 样 ， 如 例 9.10 所 示 。 














[59.10] 互 斥 锁 同步 资源 。 

















#include «stdio.h» 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <pthread.h> 
pthread mutex t mutex x= PTHREAD MUTEX INITIALIZER; 
int total_ticket_num=20; 
void *sell ticket (void *arg)( 
for (int i-0;i«20;i**)( 
pthread mutex lock(&mutex x); 
if(total ticket num>0){ 
sleep(1); ` 
printf("sell the $dth ticketWn",20-total ticket numtl); 
total ticket num--; 
} 
pthread mutex unlock(&mutex x); 
} 


return 0; 


int main (){ 
int iRet; 
pthread t tids[4]; 
int i=0; 
for (i=0;i<4; i++) { 
int iRet = pthread create(&tids[i], NULL, &sell ticket, NULL); 
if (iRet) { T 机 
printf("pthread create error, iRet-$dW",iRet); 
return iRet; T 


} 


} 
sleep (30); 
void *retval; 
for (i=0;i<4; i++) { 
iRet-pthread join(tids[i], &retval); 
if (iRet){ ` 
printf("tid-$d join error, iRet-$dWn",tids[i],iRet); 
return iRet; 
} 
printf ("retval-$1dMn", (long*) retval); 


return 0; 








程序 的 执行 结果 如 图 9-8 所 示 。 











[sharexu@linux 0910] ./test 
sell the 1th ticket 
sell the 2th ticket 
sall the n ticket 
sell 

sell 

sell 

sell 

sell 

sell 

sell |Bth ticket 
sell the 11 ticket 
sell i lth ticket 
sell the 13th ticket 
sell 1 ]4th ticket 
sell 1 h ticket 
sell |oth ticket 
sell 1 |7th ticket 
sell the 18th ticket 


sell |Gth ticket 
sell 1 şJth ticket 
retwal=0 
retwal-0 
retval=0 
retval-8 


图 9-8 例 9.10 中 程序 的 执行 结果 


程序 执行 结果 符合 预期 ， 一 共 20 张 票 ， 也 只 卖 出 了 20 张 。 例 9.10 与 例 9.9 的 不 同 之 处 只 是 加 了 全 局 的 互 斥 锁 ， 并 且 在 线程 执行 的 函数 sell_ticket 中 ，for 循 环 每 次 对 全 局 变量 total_ticket num 操作 前 加 
锁 ， 操 作 后 解锁 。 


HREAD MUTEX INITIALIZER; 


n",20-total ticket num*1l); 


) 
return 0; 


第 一 个 执行 pthread_mutex_lock () 的 线程 会 先 获得 mutex_x， 其 他 想 要 获得 mutex_x 的 线程 必须 等 待 ， 直 到 第 一 个 线程 执行 到 pthread_mutex_unlock () 释放 mutex_x， 才 可 以 获得 mutex_x， 并 
继续 执行 线程 。 所 以 线程 在 pthread_mutex_lock () 和 pthread_mutex_unlock () 之 间 操 作 时 ， 不 会 被 其 他 线程 影响 ， 就 构成 了 一 个 原子 操作 。 


需要 注意 的 时 候 ， 如 果 存 在 某 个 线程 依然 使 用 原先 的 程序 ， 即 不 尝试 获得 mutex_x， 而 直接 修改 total_ticket num ， 互 斥 锁 不 能 阻止 该 程序 修改 total_ticket num， 互 斥 锁 就 失去 了 保护 资源 的 意义 。 
所 以 ， 互 斥 锁 机 制 需 要 程序 员 自己 来 写 出 完善 的 程序 来 实现 互 斥 锁 的 功能 。 


互 斥 锁 的 使 用 过 程 中 ， 主 要 有 pthread_ mutex init, pthread mutex destory, pthread mutex lock 和 pthread_mutex_unlock 这 几 个 函数 ， 分 别 完成 锁 的 初始 化 、 锁 的 销毁 、 上 锁 和 释放 锁 操 作 。 锁 
的 创建 有 两 种 方式 ， 静 态 和 动态 。 例 9.10 中 是 以 静态 方式 创建 了 锁 ， 代 码 如 下 : 


pthread mutex t mutex x- PTHREAD MUTEX INITIALIZER; 




















另外 锁 可 以 用 pthread_mutex_init 函 数 动态 地 创建 ， 函 数 原型 如 下 : 





int pthread mutex init(pthread mutex t *mutex, const pthread mutexattr t * attr); 





对 锁 的 操作 主要 包括 加 锁 pthread_ mutex lock () . fitgiípthread mutex unlock () 和 测试 加 锁 pthread_mutex trylock () 3 个 ， 代 码 如 下 : 





int pthread mutex lock(pthread mutex t *mutex) 
int pthread mutex unlock(pthread mutex t *mutex) 
int pthread mutex trylock(pthread mutex t *mutex) 





pthread mutex trylock () 语义 与 pthread_mutex_lock () 类 似 ， 不 同 的 是 在 锁 已 经 被 占据 时 返回 EBUSY ， 而 不 是 挂 起 等 待 。 











【 例 9.11】 ”使 用 pthread_mutex_trylock 测 试 加 锁 。 

















#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <pthread.h> 
#include <errno.h> 
pthread mutex t mutex x= PTHREAD MUTEX INITIALIZER; 
int total ticket num-20; B m 
void *sell ticketl(void *arg)( 
for (int i-0;i«20;i-*)( 
pthread mutex lock(&mutex x); 
if (total ticket num»0)( 
printf("threadl sell the $dth ticket\n",20-total_ticket_num+1) ; 
total ticket num--; 





} 
sleep (1); 
pthread mutex unlock(&mutex x); 
sleep(1); 
} 


return 0; 


} 
void *sell ticket2 (void *arg){ 
int iRet-0; 
for (int i=0;i<10;i++){ 
iRet-pthread mutex trylock(&mutex x); 
if (iRet--EBUSY) ( 
printf ("sell ticket2:the variable is locked by Sell ticketl. Win"); 
Jelse if (iRet--0)( 
if(total ticket num>0){ 
printf("thread2 sell the $dth ticket Wn",20-total ticket num*l); 
total ticket num--; m 





} 
pthread mutex unlock(&mutex x); 


} 
sleep (1); 
} 


return 0; 


int main(){ 
pthread t tids[2]; 
int iRet = pthread create(&tids[0], NULL, &sell ticketl, NULL); 
if (iRet) { 
printf ("pthread create error, iRet-$dW",iRet); 
return iRet; 
} 
iRet = pthread create(&tids[1], NULL, &sell ticket2, NULL); 
if (iRet) { T E 
printf ("pthread create error, iRet-£dW",iRet); 
return iRet; 


l 
sleep(30); 
void *retval; 
iRet-pthread join(tids[0], &retval); 
if (iRet){ ` 
printf("tid-$d join error, iRet-$dWn",tids[0],iRet); 
Jelset 
printf ("retval-$1dMn", (long*) retval); 
} 
iRet-pthread join(tids[1], &retval); 
if (iRet) { 
printf("tid-$d join error, iRet-$dWn",tids[1],iRet); 
Jelse( 
printf ("retval-$1dMn", (long*) retval); 
l 


return 0; 








程序 的 执行 结果 如 图 9-9 所 示 。 











[sharexuglinux 0911]$ g++ -lpthread test test.cpp 
[sharexuglinux 09811]$ ./test 

thread2 sell the 1th ticket 

threadi sell the 2th ticket 

sell ticket2:the variable 15 locked by sell ticketl 
thread? sell the 3th ticket 

threadl sell the 4th ticket 

sell ticket2:the variable is locked sell ticketl 
thread? sell the Sth ticket 

threadl sell the 6th ticket 

sell ticket2:the variable is locked by sell_ticketl 
thread2 sell the 7th ticket 

threadl sell the 8th ticket 

sell ticket2:the variable is locked 

thread2 sell the 9th ticket 

threadl sell the lOth ticket 

sell ticket2:the variable is locked sell ticketl. 
threadl sell the llth ticket 

threadl sell the ticket 

threadl sell the l3th ticket 

threadl sell the ticket 

threadl sell the 15th ticket 

threadl sell E ticket 

threadl sell the 17th ticket 

threadi sell the 18th ticket 

threadi sell the 1 ticket 

threadl sell the 20th ticket 

retval-o 

retval-o 


Ejo-9 例 9.11 中 程序 的 执行 结果 


这 里 设计 了 一 个 函数 sell_ticket1， 直 接 使 用 pthread_mutex_lock 和 pthread_mutex_unlock 来 加 锁 和 解锁 ; 而 函数 sell_ticket2 则 是 用 pthread_mutex trylock 来 进行 尝试 加 锁 。 如 果 尝 试 失败 ， 会 返回 
EBUSY。 这 样 就 可 以 更 加 清晰 地 看 到 两 个 线程 争夺 资源 的 现象 。 


3. 条 件 变量 


互 斥 量 是 线程 程序 必需 的 工具 ， 但 并 非 是 万 能 的 。 例 如 ， 如 果 线 程 正 在 等 待 共享 数据 内 某 个 条 件 出 现 ， 那 会 发 生 什 么 呢 ? 它 可 能 重复 对 互 斥 对 象 锁定 和 解锁 ， 每 次 都 会 检查 共享 数据 结构 ， 以 查找 某 个 
值 。 但 这 是 在 浪费 时 间 和 资源 ， 而 且 这 种 繁忙 查询 的 效率 非常 低 。 


在 每 次 检查 之 间 ， 可 以 让 调用 线程 短暂 地 进入 睡眠 ， 比 如 睡眠 3 秒 ， 但 是 由 此 线程 代码 就 无 法 最 快 作出 响应 。 真 正 需要 的 是 这 样 一 种 方法 : 当 线 程 在 等 待 满足 某 些 条 件 时 使 线程 进入 睡眠 状态 ， 一 旦 条 件 
满足 ， 就 唤醒 因 等 待 满足 特定 条 件 而 睡眠 的 线程 。 如 果 能 够 做 到 这 一 点 ， 线 程 代码 将 是 非常 高 效 的 ， 并 且 不 会 占用 宝贵 的 互 斥 对 象 锁 。 而 这 正 是 条 件 变量 能 做 的 事 ! 


条 件 变 量 通过 允许 线程 阻塞 和 等 待 另 一 个 线程 发 送信 号 的 方法 弥补 互 斥 锁 的 不 足 ， 它 常 和 互 斥 锁 一 起 使 用 。 使 用 时 ， 条 件 变量 被 用 来 阻塞 一 个 线程 ， 当 条 件 不 满足 时 ， 线 程 往往 解 开 相 应 的 互 斥 锁 并 等 
待 条 件 发 生变 化 。 一 旦 其 他 的 某 个 线程 改变 了 条 件 变量 ， 它 将 通知 相应 的 条 件 变量 唤醒 一 个 或 多 个 正 被 此 条 件 变 量 阻塞 的 线程 ， 这 些 线程 将 重新 锁定 互 斥 锁 并 重新 测试 条 件 是 否 满足 。 


这 里 先 介绍 下 条 件 变量 的 相关 函数 使 用 。 
(1) 创建 : 条 件 变量 和 互 斥 锁 一 样 ， 都 有 静态 、 动 态 两 种 创建 方式 。 


静态 方式 使 用 PTHREAD_COND _INITIALIZER 常 量 ， 函 数 原 型 是 : 





pthread cond t cond-PTHREAD COND INITIALIZER 





动态 方式 则 使 














pthread cond _init 函 数 ，pthread_cond _init 的 函数 原型 是 : 


int pthread cond init (pthread cond t *cond, pthread condattr t *cond attr) 











使 























cond attr 指 定 的 属性 初始 化 条 件 变量 cond， 当 cond _attr 为 NULL 时 ， 使 用 默认 的 





























属性 。LinuxThreads 实 现 条 件 变 量 不 支持 属性 ， 因 此 cond_attr 参 数 实际 被 忽略 。 











(2) 注销 : 注销 一 个 条 件 变 量 需要 调用 pthread_cond destroy () ， 它 的 函数 原型 是 : 











int pthread cond destroy (pthread cond t *cond) 





只 有 在 没有 线程 在 该 条 件 变量 上 等 待 的 时 候 才能 注销 这 个 条 件 变量 ， 否 则 返回 EBUSY。 


(3) 等 待 : 等 待 条 件 有 两 种 方式 条 件 等 待 pthread_cond_wait () 和 计时 等 待 pthread_ cond timedwait () 。 











因为 Linux 实 现 的 条 件 变量 没有 分 配 什么 资源 ， 所 以 注销 动作 只 包括 检查 是 否 有 等 待 线程 。 




















中 计时 等 待 方式 如 果 在 给 定时 刻 前 条 件 没有 满足 ， 则 返回 ETIMEOUT， 结 束 等 














待 。 其 中 abstime 以 与 time () 系统 调用 相同 意义 的 绝对 时 间 形 式 出 现 ，0 表 示 格 林 尼 治 时 间 


无 论 哪 种 等 待 方式 ， 都 必须 和 一 个 互 斥 锁 配 合 





1970 年 1 月 1 日 0 时 0 分 0 秒 。 














， 以 防止 多 个 线程 同时 请 求 pthread_ cond wait () (或 pthread cond timedwait () ) 的 竞争 条 件 。mutex 互 斥 锁 必 须 是 普通 锁 











(PTHREAD MUTEX TIMED NP) 或 者 适应 锁 (PTHREAD MUTEX ADAPTIVE NP) ， 且 在 调用 pthread_cond_wait () 前 必须 由 本 线程 加 锁 (pthread mutex lock () ) ， 而 在 更 新 条 件 等 待 队列 以 
前 ，mutex 需 保持 锁定 状态 ， 并 在 线程 挂 起 进入 等 待 前 解锁 。 在 条 件 满 足 从 而 离开 pthread_cond wait () 之 前 ，mutex 将 被 重新 加 锁 ， 以 与 进入 pthread_cond_wait () 前 的 加 锁 动作 对 应 。 
pthread cond wait () 和 pthread cond timedwait () 的 函数 原型 分 别 是 : 














int pthread cond wait (pthread cond t *cond, pthread mutex t *mutex) 
int pthread « cond 1 | timedwait (pthread « cond t *cond, pthread ! mutex t *mutex, const struct timespec *abstime) 


(4) 激发 : 激发 条 件 有 两 种 形式 : pthread cond signal () 激活 一 个 


pthread cond _signal 函 数 的 作用 是 发 送 一 个 信号 给 另外 一 个 正在 处 于 阻塞 等 待 状态 的 线程 ， 使 其 脱离 阻塞 状态 ， 继 续 执行 。 如 果 没 有 线程 处 在 阻塞 等 待 状态 ，pthread_cond signal 也 会 成 功 返 回 。 








使 





各 等 待 线程 优先 级 的 高 低 确定 哪个 线程 会 接收 到 信号 


信号 。 


【 例 9.12】 条件 变量 的 初次 使 用 。 












































秆 待 该 条 件 的 线程 ， 存 在 多 个 等 待 线程 时 按 入 了 顺序 激活 








中 一 个 ; 而 pthread_cond_broadcast () 则 激活 所 有 等 待 线程 。 




















pthread_cond_signal 不 会 有 有“ 惊 群 现象 。 (每 当 有 资源 可 用 ， 所 有 的 进程 /线程 都 来 竞争 资源 ) 产生 ， 它 最 多 只 给 一 个 线程 发 信号 。 假 如 有 多 个 线程 正在 阻塞 等 待 着 这 个 条 件 变 量 的 话 ， 那 么 根据 
并 开始 继续 执行 ; 如 果 各 线程 优先 级 相同 ， 则 根据 等 待 时 间 的 长 短 来 确定 哪个 线程 获得 信号 。 但 无 论 如 何 ， 一 个 pthread cond_signal 调 用 最 多 发 一 次 




















#include <iostream> 
#include <pthread.h> 
using namespace std; 


pthread cond t qready 
pthread mutex t qlock 


PTHREAD COND INITIALIZER; 
PTHREAD MUTEX INITIALIZER; 


int x = 10; 
int y = 20; 
void *func1 (void *arg)( 


cout««"funcl start"««endl; 
pthread mutex lock (&qlock); 
while (xy) 


pthread cond wait (&qready, &qlock); 
l 
pthread mutex unlock (&qlock); 
sleep(3); 
cout««"funcl end"««endl; 


void *func2 (void *arg)í 


int 


cout««"func2 start"««endl; 
pthread mutex lock (&qlock); 
x-20; T 
y 7 10; 
cout««"has change x and y"««endl; 
pthread mutex unlock (&qlock); 
if(x > y){ 

pthread cond signal (&qready); 


cout««"func2 end"««endl; 


main(int argc,char **argv)í 
pthread t tidl,tid2; 
int iRet; 
iRet = pthread create (&tidl,NULL, funcl, NULL); 
if (iRet) { 
cout<<"pthread 1 create error"<<endl; 
return iRet; 


} 
sleep (2); 
iRet = pthread create (&tid2, NULL, func2, NULL); 
if (iRet) { T 
cout««"pthread 2 create error"<<endl; 
return iRet; 


} 
sleep (5); 
return 0; 








程序 的 执行 结果 如 图 9-10 所 示 。 











/* 初 始 构 造 条 件 变量 */ 
/* 初 始 构 造 锁 */ 


[sh 
[sh 


d 
I 
cl 


fun 


func? 


re 
re 
nine 

tart 


has change x and 
funmcza end 


func 


1 end 


[sharexuglin 


例 9.12 中 创建 了 2 个 线程 ， 分 别 执行 func1 函 


图 9-10 


数 和 func2 函 数 。 为 了 确保 线程 1 先 执行 ， 这 重 


例 9.12 中 程序 的 执行 结果 








iRet = pthread create (&tidl,NULL, funcl, NULL); 


if (iRet) { 


cout<<"pthread 1 create error"<<endl; 
return iRet; 


l 
sleep(2); 


iRet = pthread create (&tid2, NULL, func2, NULL) ; 


if (iRet) { 


cout<<"pthread 2 create error"<<endl; 
return iRet; 


在 func1 函 数 中 ， 
int x = 10; 
int y = 20; 


局 变量 x<y， 





如 果 











void *func1 (void *arg) { 
cout««"funcl start"««endl; 
pthread mutex lock (&qlock); 


while (xy) 
{ 


pthread cond wait (&qready, &qlock) ; 


} 


pthread mutex z unlock (&qlock) ; å 


sleep (37; 


cout««"funcl end"««endl; 





在 func2 函 数 中 ， 把 x 和 y 的 值 都 改变 了 ， 导 致 X>y， 这 和 


信号 ， 并 且 继续 执行 。 


void *func2 (void *arg)( 
Cout<<"func2 start"««endl; 
pthread mutex lock (&qlock); 


= 20; 
y = 10; 





cout««"has change x and y"««endl; 
pthread mutex unlock (&qlock) " 


if(x > y 


pthread cond signal (&qready); 


} 


cout<<"func2 end"<<endl; 








因此 ， 程 序 的 执行 结果 是 func1 先 开始 ， 然 后 func2 执 行 ; 当 func2 执 和 











对， 再 用 pthread cond signal 函 数 发 送 一 个 信号 给 另外 一 个 正在 处 了 


在 创建 线程 2 之 前 ， 先 sleep 2 秒 ， 以 便 可 以 更 








了 完毕 后 ， 继 续 执行 fun1。 
































条 件 变量 特别 适 
见 ,条 件 变 


【 例 9.13】 


#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 








于 多 个 线程 等 待 某 个 条 件 的 发 生 。 如 果 不 使 











量 是 个 好 东西 ， 不 过 如 果 





出 租车 的 疑问 。 


<stdio.h> 
«stdlib.h» 
<string.h> 
<unistd.h> 
<pthread.h> 
<errno.h> 
<iostream> 
<pthread.h> 


namespace std; 
/* 提 示 出 租车 到 达 的 条 件 变量 */ 
pthread cond t taxiCond = PTHREAD COND INITIALIZER; 


/* 同 步 锁 */ 














阻塞 等 待 状 态 的 线程 ， 


清晰 地 看 到 条 件 变 量 的 作用 。 


则 阻塞 等 待 ， 否 则 继续 。 由 于 线程 1 先 执行 ， 而 且 x 初 始 化 的 值 是 10，y 初 始 化 的 值 是 20， 所 以 这 里 会 阻塞 等 待 。 





其 脱离 阻塞 状态 ， 








得 不 好 ， 也 容易 产生 问题 。 例 9.13 举 了 出 租车 的 例子 。 


u 


pthread mutex t taxiMutex — PTHREAD MUTEX INITIALIZER; 


void * traveler arrive(void * name){ 
cout««"Traveler: 


pthread mutex lock (&taxiMutex); 
pthread cond wait (&taxiCond, &taxiMutex); 
pthread mutex unlock (&taxiMutex); 


cout««"Traveler: 


pthread exit ((void*)0); 


} 


void * taxi arrive (void * name) { 


cout<<"Taxi: 


pthread cond signal (&taxiCond); 
pthread exit ((void*)0); 


int main(){ 


pthread t 


int iRet = pthread create (&tids[0],NULL,taxi arrive, (void*) (" 


if (iRet) { 


printf ("pthread create error: 


tids[3]; 


return iRet; 


"<< (char *)name««" needs a taxi now!"««endl; 


"<< (char *)name««" now got a taxi!"««endl; 


"<< (char *)name««" arrives."««endl; 


Jack ")); 


iRet-$dWn",iRet); 


继续 执行 。 这 


条 件 变量 ， 那 么 每 个 线程 就 需要 不 断 尝 试 获得 互 斥 锁 并 检查 条 件 是 否 发 生 ， 这 样 大 大 浪费 了 系统 的 资源 。 





里 线程 1 就 会 收 到 


printf ("Time passing by.\n"); 


sleep (1); 
iRet = pthread create(&tids[1],NULL,traveler arrive, (void*) (" Susan ")); 
if (iRet) { e B 
printf("pthread create error: iRet-$dW",iRet); 
return iRet; T 
} 
printf ("Time passing by.\n"); 
sleep (1); 
iRet = pthread create(&tids[2],NULL,taxi arrive, (void*) (" Mike ")); 
if (iRet) { T T 


printf ("pthread create error: iRet=%d\n", iRet); 
return iRet; 


} 
printf ("Time passing by.\n"); 
sleep (1); 
void *retval; 
for (int i=0;i<3;i++){ 
iRet=pthread_join (tids [i], &retval); 
if (iRet){ ~ 
printf("pthread join error: iRet-$dWn",iRet); 
return iRet; T 
} 
printf ("retval=%ld\n", (long) retval); 


return 0; 





程序 的 执行 结果 如 图 9-11 所 示 。 











needs a taxi now! 


a taxi! 
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图 9-11 例 9.13 中 程序 的 执行 结果 




















例 9.13 中 模拟 了 出 租车 与 乘客 的 到 达 情 况 。 程 序 中 一 共 创 建 了 3 个 线程 ，2 个 是 出 租车 (调用 出 租车 到 达 的 函数 ) ，1 个 是 乘客 (调用 乘客 到 达 的 函数 ) ， 顺 序 分 别 是 出 租车 Jack 先 到 ， 过 了 1 秒 ， 乘 客 
Susan 再 到 ， 再 过 1 秒 ， 出 租车 Mike 最 后 到 。 























pthread t tids[3]; 
int iRet = pthread create(&tids[0],NULL,taxi arrive, (void*) (" Jack ")); 
if (iRet) { u i 

printf("pthread create error: iRet-$dW",iRet); 

return iRet; di 


l 
printf ("Time passing by.\n"); 
sleep (1); 
iRet = pthread create(&tids[1],NULL,traveler arrive, (void*) (" Susan ")); 
if (iRet) { i E 
printf ("pthread create error: iRet-$dW",iRet); 
return iRet; Bl 


} 
printf ("Time passing by.\n"); 
sleep(1); 
iRet = pthread create(&tids[2],NULL,taxi arrive, (void*) (" Mike ")); 
if (iRet) { 网 T 
printf ("pthread create error: iRet-$dW",iRet); 
return iRet; T 


} 
printf ("Time passing by.\n"); 
sleep (1); 














程序 有 一 个 条 件 变量 ， 用 于 提示 出 租车 到 达 ， 还 有 一 个 同步 锁 ， 代 码 如 下 : 














/*3i 
pthread cond t taxiCond - PTHREAD COND INITIALIZER; 
/* 同 步 锁 */ 7 


pthread mutex t taxiMutex = PTHREAD MUTEX INITIALIZER; 


乘客 到 达 的 函数 ， 就 是 来 了 之 后 就 等 车 。 





void * traveler arrive(void * name)( 
cout««"Traveler: "««(char *)name««" needs a taxi now!"««endl; 
pthread mutex lock(&taxiMutex); 
pthread cond wait (&taxiCond, &taxiMutex) ; 
pthread mutex unlock (&taxiMutex); 
cout««"Traveler: "««(char *)name««" now got a taxi!"««endl; 


pthread exit ((void*)0); 





出 租车 到 达 的 函数 ， 就 是 来 了 之 后 就 通知 乘客 。 





void * taxi arrive (void * name)( 
cout««"Taxi: "««(char *)name««" arrives."««endl; 
pthread cond signal (&taxiCond); 
pthread exit ((void*)0); 








那 程序 的 执行 结果 显示 : Jack 到 了 站 台 一 看 没 人 ， 触 发 的 条 件 变 量 被 直接 复位 ， 于 是 Jack 排 在 等 待 队列 里 面 。 来 迟 1 秒 的 Susan 到 了 站 人 台 却 看 不 到 在 那里 等 待 的 Jack， 只 能 等 待 ， 直 到 Mike 开 车 赶 到 ， 
新 触发 条 件 变 量 ，Susan 才 上 了 车 。 疑 问 有 两 个 ，Susan 来 的 时 候 明明 有 Jack 的 出 租车 在 ， 两 边 却 都 在 白 等 ; Susan 最 后 是 上 了 Jack 的 车 ， 还 是 上 了 Mike 的 车 ? 





























中 











这 里 其 实 是 没有 掌握 好 触发 的 时 机 。 我 们 可 以 增加 一 个 计数 器 记录 等 待 线程 的 个 数 ， 在 决定 触发 条 件 变量 前 检查 该 变量 即 可 。 改 后 程序 如 例 9.14 所 示 。 


[914] ”完美 的 出 租车 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 
#include <pthread.h> 
#include <errno.h> 
#include <iostream> 
#include <pthread.h> 
using namespace std; 
/* 提 示 出 租车 到 达 的 条 件 变量 */ 
pthread cond t taxiCond = PTHREAD COND INITIALIZER; 
/* 同 步 锁 */ 
pthread mutex t taxiMutex = PTHREAD MUTEX INITIALIZER; 
int travelerCound=0; 
void * traveler arrive (void * name)( 

cout««"Traveler: "««(char *)name««" needs a taxi now!"««endl; 

pthread mutex lock(&taxiMutex); 

travelerCoundt*; 

pthread cond wait (&taxiCond, &taxiMutex); 

pthread mutex unlock (&taxiMutex); 

cout««"Traveler: "««(char *)name««" now got a taxi!"««endl; 

pthread exit ((void*)0); 





} 
void * taxi arrive (void * name)( 
cout««"Taxi: "««(char *)name««" arrives."««endl; 
while (1){ 
pthread mutex lock(&taxiMutex); 
if (travelerCound»0)( 
pthread cond signal (&taxiCong); 
pthread mutex unlock (&taxiMutex); 
break; 


pthread mutex unlock (&taxiMutex); 
} 
pthread exit ((void*)0); 


int main (){ 
pthread t tids[3]; 
int iRet = pthread create (&tids[0],NULL,taxi arrive, (void*) (" Jack ")); 
if (iRet) { 
printf ("pthread create error: iRet=%d\n", iRet); 
return iRet; 


$ 
printf ("Time passing by.\n"); 
sleep (1); 
iRet = pthread create (&tids[1],NULL,traveler arrive, (void*) (" Susan ")); 
if (iRet) { 
printf ("pthread create error: iRet-$dWn",iRet); 
return iRet; 
} 
printf ("Time passing by.\n"); 
Sleep (1); 
iRet = pthread create (&tids[2],NULL, taxi arrive, (void*) (" Mike ")); 
if (iRet) { 
printf ("pthread create error: iRet=%d\n", iRet); 
return iRet; 
} 
printf ("Time passing by.\n"); 
sleep (1); 
void *retval; 
for (int i=0;i<3;i++){ 
iRet=pthread_join (tids [i], &retval); 
if (iRet){ 
printf ("pthread join error: iRet=%d\n", iRet) ; 
return iRet; 
} 
printf ("retval=%ld\n", (long) retval); 


return 0; 








程序 的 执行 结果 如 图 9-12 所 示 。 











[sharexuialinux 6 
[sharexuglinux 6 
Tıme passing by. 
Taxi: Jack arrives. 
Time passing by. 
Traveler: Susan 
Traveler: Susan 
Time "s ing by. 

tike arrives., 


914 
014] £ 


ra I 


exu@linux 091415 f 


图 9-12” 例 9.14 中 程序 的 执行 结果 





























这 样 ，Susan 一 来 就 发 现 了 Jack 的 车 ， 双 方 都 不 用 白 等 。 


对 比例 9.13， 程 序 有 以 下 不 同 。 














增加 了 一 个 记录 旅客 数量 的 变量 。 旅 客 到 达 时 ， 这 个 变量 会 加 1， 代 码 如 下 : 


int travelerCound=0; 
void * traveler | arrive (void * name){ 
cout««"Traveler: "««(char *)name««" needs a taxi now!"««endl; 
pthread mutex lock (&taxiMutex); 
travelerCound**; 
pthread cond : wait (&taxiCond, &taxiMutex); 
pthread mutex unlock (&taxiMutex); 
cout««"Traveler: "««(char *)name««" now got a taxi!"««endl; 
pthread exit ((void*)0); 

















出 租车 到 达 的 函数 中 ， 加 了 个 while 永 真 循环 ， 这 样 可 以 保证 先 来 的 Jack 也 能 检测 到 是 否 有 顾客 到 达 。 在 循环 中 判断 顾客 人 数 是否 大 于 0， 如 果 大 于 0， 则 通知 Jack。 这 样 ， 先 来 的 Jack 便 接 到 了 顾客 ， 代 
码 如 下 : 





void * taxi arrive (void * name){ 
cout««"Taxi: "««(char *)name««" arrives."««endl; 
while (1)( 
pthread mutex lock(&taxiMutex); 
if (travelerCound»O) { 
pthread cond | signal (&taxiCond); 
pthread mutex | unlock (&taxiMutex); 
break; 


} 
pthread mutex unlock (&taxiMutex); 


} 
pthread exit ((void*)0); 


在 一 些 程序 中 存在 读者 写 者 问题 ， 也 就 是 说， 对 某 些 资源 的 访问 会 存在 两 种 可 能 的 情况 ， 一 种 是 访问 必须 是 排他 性 的 ， 就 是 独占 的 意思 ， 这 称 作 写 操作 ; 另 一 种 情况 就 是 访问 方式 可 以 是 共享 的 ， 就 是 
说 可 以 有 多 个 线程 同时 去 访问 某 个 资源 ， 这 种 就 称 作 读 操作 。 这 个 问题 模型 是 从 对 文件 的 读 写 操作 中 引申 出 来 的 。 


















































(1) 读 写 锁 比 起 互 斥 锁具 有 更 高 的 适用 性 与 并 行 性 ， 可 以 有 多 个 线程 同时 占用 读 模式 的 读 写 锁 ， 但 是 只 能 有 一 个 线程 占用 写 模式 的 读 写 锁 ， 读 写 锁 的 3 种 状态 如 下 所 述 。 





























) 当 读 写 锁 是 写 加 锁 状 态 时 ， 在 这 个 锁 被 解锁 之 前 ， 所 有 试图 对 这 个 锁 加 锁 的 线程 都 会 被 阻塞 。 

















2) 当 读 写 锁 在 读 加 锁 状 态 时 ， 所 有 试图 以 读 模式 对 它 进行 加 锁 的 线程 都 可 以 得 到 访问 权 ， 但 是 以 写 模式 对 它 进行 加 锁 的 线程 将 会 被 阻塞 。 


D 























3) 当 读 写 锁 在 读 模式 的 锁 状 态 时 ， 如 果 有 另外 的 线程 试图 以 写 模式 加 锁 ， 读 写 锁 通 常会 阻塞 随后 的 读 模式 锁 的 请 求 ， 这 样 可 以 避免 读 模式 锁 长 期 占用 ， 而 等 待 的 写 模式 锁 请 求 则 长 期 阻塞 。 






































读 写 锁 最 适用 于 对 数据 结构 的 读 操作 次 数 多 于 写 操作 次 数 的 场合 ， 因 为 读 模式 锁定 时 可 以 共享 ， 而 写 模式 锁定 时 只 能 由 某 个 线程 独占 资源 ， 因 而 读 写 锁 也 可 以 叫 作 共享 -独占 锁 。 
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处 理 读者 - 写 者 问题 的 两 种 常见 策略 是 强 读者 同步 (strong reader synchronization) 和 强 写 者 同步 (strong writer synchronization) 。 在 强 读者 同步 中 ， 总 是 给 读者 更 高 的 优先 权 ， 只 要 写 者 当前 没 
有 进行 写 操作 ， 读 者 就 可 以 获得 访问 权限 ; 而 在 强 写 者 同步 中 ， 则 往往 将 优先 权 交 付 给 写 者 ， 而 读者 只 能 等 到 所 有 正在 等 待 的 或 者 正在 执行 的 写 者 结束 以 后 才能 执行 。 关 于 读者 - 写 者 模型 ， 由 于 读者 往往 会 
要 求 查看 最 新 的 信息 记录 ， 例 如 航班 订 票 系统 往往 会 使 用 强 写 者 同步 策略 ， 而 图 书馆 查阅 系统 则 采用 强 读者 同步 策略 。 


































































































(2) 读 写 锁 机 制 是 由 POSIX 提 供 的 ， 如 果 写 者 没有 持 有 读 写 锁 ， 那 么 所 有 的 读者 都 可 以 持 有 这 把 锁 ， 而 一 旦 有 某 个 写 者 阻塞 在 上 锁 的 时 候 ， 那 么 就 由 POSIX 系 统 来 决定 是 否 人 允许 读 者 获取 该 锁 。 























接 下 来 我 们 来 看 读 写 锁 相 关 的 函数 使 用 ， 如 下 所 述 。 





1) 初始 化 和 销毁 读 写 锁 。 


对 于 读 写 锁 变 量 的 初始 化 可 以 有 两 种 方式 ， 一 种 是 通过 给 一 个 静态 分 配 的 读 写 锁 赋 予 常 值 PTHREAD_RWLOCK_INITIALIZER 来 初始 化 它 ; 另 一 种 方法 就 是 通过 调用 pthread_rwlock init () 来 动态 地 初 














始 化 。 而 当 某 个 线程 不 再 需要 读 写 锁 的 时 候 ， 可 以 通过 调用 pthread _rwlock_destroy 来 销毁 该 锁 。 函 数 原 型 如 下 : 











int pthread rwlock init(pthread rwlock t *rwptr, const pthread rwlockattr t *attr); 
int pthread : rwlock « . destroy (pthread : rwlock i t *rwptr); 





这 两 个 函数 如 果 执行 成 功 均 返回 0， 如 果 出 错 则 返回 错误 码 。 














在 释放 某 个 读 写 锁 占 用 的 内 存 之 前 ， 要 先 通 过 pthread_rwlock_destroy 对 读 写 锁 进 行 清理 ， 释 放 由 pthread_rwlock_init 所 分 配 的 资源 。 





























在 初始 化 某 个 读 写 锁 的 时 候 ， 如 果 属 性 指针 attr 是 个 空 指针 的 话 ， 表 示 使 用 默认 属性 ; 如 果 想 要 使 用 非 默认 属性 ， 则 要 使 用 到 下 面 的 两 个 函数 : 


























int pthread rwlockattr_init (pthread rwlockattr t *attr); 
int pthread rwlockattr destroy (pthread rwlockatttr t *attr); 





同样 的 ， 这 两 个 函数 如 果 执 行 成 功 则 返回 0， 失 败 则 返回 错误 码 。 





这 里 还 需要 说 明 的 是 ， 当 初始 化 读 写 锁 完 毕 以 后 ， 该 锁 就 处 于 一 种 非 锁定 状态 。 





























数据 类 型 为 pthread rwlockattr t 的 某 个 属性 对 象 一 旦 初始 化 了 ， 就 可 以 通过 不 同 的 函数 调用 来 启用 或 禁用 某 个 特定 的 属 



































rd 


2) 获取 和 释放 读 写 锁 。 











读 写 锁 的 数据 类 型 是 pthread _rwlock_t， 如 果 这 个 数据 类 型 中 的 某 个 变量 是 静态 分 配 的， 那么 可 以 通过 给 它 赋 予 常 值 PTHREAD_RWLOCK_INITIALIZAR 来 初始 化 它 。pthread rwlock rdlock () 用 来 
获取 读 出 锁 ， 如 果 相 应 的 读 出 锁 已 经 被 某 个 写 入 者 占有 ， 那 么 就 阻塞 调用 线程 。 















































pthread rwlock wrlock () 以 获取 一 个 写 入 锁 ， 如 果 相 应 的 写 入 锁 已 经 被 其 他 写 入 者 或 者 读 出 者 占有 (一 个 或 多 个 ) ， 那 么 就 阻塞 该 调用 线程 ; pthread rwlock unlock () 用 来 释放 一 个 读 出 或 者 
写 入 锁 。 函 数 原型 如 下 : 














int pthread rwlock rdlock(pthread rwlock t *rwptr); 
int pthread rwlock wrlock(pthread rwlock t *rwptr); 
int pthread rwlock unlock (pthread : rwlock t *rwptr); 


























这 3 个 函数 若 调用 成 功 则 返回 0， 失 败 则 返回 错误 码 。 要 注意 的 是 ， 其 中 获取 锁 的 两 个 函数 的 操作 都 是 阻塞 操作 ， 也 就 是 说 获取 不 到 锁 的 话 ， 那 么 调用 线程 不 是 立即 返回 ， 而 是 阻塞 执行 。 有 写 情 况 下 ， 
这 种 阻塞 式 的 获取 锁 的 方式 可 能 不 是 很 适用 ， 所 以 ， 接 下 来 引入 两 个 采用 非 阻 塞 方式 获取 读 写 锁 的 函数 pthread_rwlock tryrdlock () 和 pthread rwlock trywrlock () ， 非 阻塞 方式 下 获取 锁 的 时 候 ， 如 
果 不 能 马上 获取 到 ， 就 会 立即 返回 一 个 EBUSY 错 误 提 示 ， 而 不 是 把 调用 线程 投入 到 睡眠 等 待 。 函 数 原 型 如 下 : 












































int pthread rwlock tryrdlock(pthread rwlock t *rwptr); 
int pthread rwlock trywrlock(pthread rwlock t *rwptr); 














同样 ， 这 两 个 函数 调用 成 功 则 返回 0， 失 败 则 返回 错误 码 。 





























下 面 用 个 实例 ( 见 例 9.15) 来 展示 下 读 写 锁 的 使 用 。 




















【 例 9.15】 ” 读 写 锁 的 使 用 。 

















finclude <stdio.h> 

#include <pthread.h> 

#include <stdlib.h> 

#include <unistd.h> 

#define THREADNUM 5 

pthread rwlock t rwlock; 

void *readers (void *arg)( 
pthread rwlock rdlock(&rwlock); 
printf ("reader $1d got the lock\n", (long)arg); 
pthread rwlock unlock (&rwlock); 
pthread exit ((void*)0); 


void *writers (void *arg)( 
pthread rwlock wrlock(&rwlock); 
printf ("writer $1d got the lock\n", (long)arg); 
pthread rwlock unlock(&rwlock); 
pthread exit ((void*)0); 


int main (int argc, char **argv)( 

int iRet, i; 

pthread t writer id, reader id; 

pthread attr t attr; 

int nreadercount = 1, nwritercount - 1; 

iRet = pthread rwlock init(&rwlock, NULL); 

if (Ret) ( 
fprintf (stderr, "init lock failedWin"); 
return iRet; 


} 
pthread attr init(&attr); 
/*pthread attr setdetachstate 用 来 设置 线程 的 分 离 状态 ， 也 就 是 说 一 个 线程 怎么 样 终止 自己 ， 
状态 设置 为 PTHREAD CREATE DETACHED, 表示 以 分 分 离 状态 启动 线程 */ 
pthread attr setdetachstate (&attr, PTHREAD CREATE DETACHED); 
for (i = 0; I < THREADNUM; i++){ 
if (1$3)t 
pthread create(&reader id, &attr, readers, (void *)nreadercount); 
printf ("create reader $dWn", nreadercounte4); 
} else ( 
pthread create(&writer id, &attr, writers, (void *)nwritercount); 
printf("create writer £d", nwritercount-t); 


} 
} 
sleep(5); /*sleep 是 为 了 等 待 另外 的 线程 的 执行 */ 


return 0; 








程序 的 执行 结果 如 图 9-13 所 示 。 











u@linux 0915]$ gi -tpthre ad -0 test test.cpp 
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图 9-13” 例 9.15 中 程序 的 执行 结果 




















在 例 9.15 中 ， 定 义 了 一 个 全 局 的 读 写 锁 。 在 main 函 数 中 ， 初 始 化 了 读 写 锁 ， 创 建 了 5 个 线程 ， 其 中 有 3 个 调用 了 readers 函 数 ， 有 2 个 调用 了 writers 函 数 。 而 readers 函 数 中 ， 加 上 读 锁 ， 输 出 提示 语 
解锁 ; 而 writers 函 数 中 ， 加 上 写 锁 ， 输 出 提示 语 后 解锁 。 读 加 锁 的 线程 比 写 加 锁 的 线程 多 ， 方 便 看 到 哪个 线程 容易 获得 锁 。 执 行 结果 展示 ， 当 读 写 锁 是 写 加 锁 状 态 时 ， 在 这 个 锁 被 解锁 之 前 ， 所 有 试图 对 这 
个 锁 加 锁 的 线程 都 会 被 阻塞 ; 当 读 写 锁 在 读 加 锁 状 态 时 ， 所 有 试图 以 读 模式 对 它 进 行 加 锁 的 线程 都 可 以 得 到 访问 权 ， 但 是 以 写 模 式 对 它 进行 加 锁 的 线程 将 会 被 阻塞 。 




















到 
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线程 还 可 以 通过 信号 量 来 实现 通信 。 信 号 量 和 互 斥 锁 的 区 别 : 互 斥 锁 只 允许 一 个 线程 进入 临界 区 ， 而 信号 量 允 许多 个 线程 同时 进入 临界 区 。 
函数 的 名 字 都 以 "sem_" 打 头 。 线 程 使 用 的 基本 信号 量 函 数 有 以 下 4 个 。 
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信号 量 同 步 ， 需 要 包含 头 文件 semaphore.h。 信 号 量 























(1) sem _init 函 数 。 




















该 函数 用 于 创建 信号 量 ， 其 原型 如 下 : 





int sem init(sem t *sem, int pshared, unsigned int value); 
































该 函数 用 于 初始 化 由 sem 指 向 的 信号 对 象 ， 设 置 它 的 共享 选项 ， 并 给 它 一 个 初始 的 整数 值 。pshared 控 制 信号 量 的 类 型 ， 如 果 
在 多 个 进程 之 间 共 享 。value 为 sem 的 初始 值 。 调 用 成 功 时 返回 9， 失 败 返 回 -1。 





值 为 0， 就 表示 这 个 信号 量 是 当前 进程 的 局 部 信号 量 ， 否 则 信号 量 就 可 以 





(2) sem_wait 函 数 。 



































该 函数 用 于 以 原子 操作 的 方式 将 信号 量 的 值 减 1。 原 子 操作 就 是 ， 如 果 两 个 线程 企图 同时 给 一 个 信号 量 加 1 或 减 1， 它 们 之 间 不 会 互相 干扰 。 函 数 的 原型 如 下 : 





int sem wait(sem t *sem); 




















sem 指 向 的 对 象 是 由 sem_init 调 用 初始 化 的 信号 量 。 调 用 成 功 时 返回 0， 失 败 返 回 -1。 
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(3) sem postPAZi, 




















该 函数 用 于 以 原子 操作 的 方式 将 信号 量 的 值 加 1， 函 数 的 原型 如 下 : 








int sem post(sem t *sem); 























与 sm_wait 一 样 ，sem 指 向 的 对 象 是 由 sem_init 调 用 初始 化 的 信号 量 。 调 用 成 功 时 返回 0， 失 败 返 回 -1。 



































(4) sem_destroy 函 数 。 

















该 函数 用 于 对 用 完 的 信号 量 进 行 清理 ， 函 数 的 原型 如 下 : 

















int sem destroy (sem t *sem); 


成 功 时 返回 0， 失 败 时 返回 -1。 





























下 面 用 例 9.16 演 示 如 何 用 信号 量 同步 ， 模 拟 一 个 窗口 服务 系统 。 





















































信号 量 模拟 窗口 服务 系统 。 














#include <pthread.h> 
#include <semaphore.h> 
#include «unistd.h» 
#include <stdio.h> 
#include <stdlib.h> 
#define CUSTOMER NUM 10 





/* 注意 : x &thread id 的 值 因为 thread id 是 对 主线 
int customer id= x ( (int *)thread id); 
if (sem: wait(&sem) — 0) ( 
usleep(100); /* service time: 100ms */ 
printf ("customer $d receive service http://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...NMn", customer id); 
sem post (&sem) ; 


) 





int main(int argc, char *argv[] )t 
， 表 示 有 两 个 





int customer id = i; 
iRet = pthread create (&customers [i] , NULL, get service, &customer id); 
if (iRet) { 
perror ("pthread create"); 
return iRet; T 
} 
elset 
printf ("Customer $d arrived.Wn", i); 


} 
usleep (10); 





量 ， 因 为 可 正在 访问 1 的 值 */ 





for(j = 0; j < CUSTOMER NUM; j++) { 
pthread join(customers[j], NULL); 


l 

/* 销 毁 信 号 量 */ 
Sem_destroy (&sem) ; 
return 0; 








程序 的 执行 结果 如 图 9-14 所 示 。 
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图 9-14” 例 9.16 中 程序 的 执行 结果 




















例 9.16 中 模拟 的 是 一 个 营业 厅 只 能 同时 服务 两 个 顾客 的 情况 ， 当 有 多 个 顾客 到 来 时 ， 每 个 顾客 如 果 发 现 服务 窗口 已 满 ， 就 等 待 ， 当 有 可 用 的 服务 窗口 时 ， 就 接受 服务 。 
































将 信号 量 定义 为 全 局 变量 ,方便 多 个 线程 共享 。 





sem t sem; 


main 函 数 中 ， 初 始 化 信号 量 ， 初 始 值 为 2， 表 示 有 两 个 顾客 可 以 同时 接受 服务 ， 代 码 如 下 : 


sem init (&sem, 0,2); 












































为 每 个 顾客 生成 一 个 线程 ， 好 像 顾客 陆续 到 来 一 样 ， 并 且 每 个 线程 都 调用 get_service 函 数 。 注 意 ，get_service 了 水 数 要 立即 保存 thread_id 的 值 ， 因 为 thread_id 是 对 主线 程 中 循环 变量 的 引用 ， 它 可 能 马 
上 被 修改 。if (sem wait (&sem) ==0) 表示 当前 信号 量 大 于 0， 可 以 为 该 顾客 服务 ， 并 将 信号 量 -1， 服 务 完成 后 ， 就 得 调用 sem_post 把 信号 量 加 1， 以 便 继续 为 其 他 顾客 服务 ， 代 码 如 下 : 














void * get service(void *thread id)( 
int customer id = *((int *)thread id); 
if(sem wait(&sem) — 0) ( 
usleep(100); /* service time: 100ms */ 

















printf ("customer $d receive service http://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...WMn", customer id); 


sem post (&sem) ; 
$ 
} 























多 线程 的 几 种 同步 方式 已 介绍 完毕 ， 大 家 应 该 结合 实际 需要 ， 选 择 适当 的 方式 进行 使 用 。 





9.5 “多 线程 重 入 

















前 面 介 绍 了 各 种 同步 方式 ， 其 实 都 是 为 了 解决 “函数 不 可 重 入 ”的 问题 。 所 谓 “ 可 重 入 函数 ”， 是 指 可 以 由 多 于 一 个 任务 并 发 使 









































一 个 任务 所 占用 ， 除 非 能 确保 函数 的 互 斥 (或 者 使 用 信号 量 ， 或 者 在 代码 的 关键 部 分 禁用 中 断 ) 。 可 重 入 函数 可 以 在 任意 时 刻 被 中 断 ， 
在 使 用 全 局 变量 时 保护 自己 的 数据 。 




































































(1) 可 重 入 函数 有 以 下 特点 。 








A 


不 为 连续 的 调用 持 有 静态 数据 。 





2) 不 返回 指向 静态 数据 的 指针 。 











Ww 


所 有 数据 都 由 函数 的 调用 者 提供 。 

















4) 使 用 本 地 数据 ， 或 者 通过 制作 全 局 数据 的 本 地 副本 来 保护 全 局 数据 。 






































5) 如 果 必 须 访问 全 局 变量 ， 要 利用 互 斥 锁 、 信 号 量 等 来 保护 全 局 变量 。 






































6) 绝 不 调用 任何 不 可 重 入 函数 。 











(2) 不 可 重 入 函数 有 以 下 特点 。 














1) 函数 中 使 用 了 静态 变量 ， 无 论 是 全 局 静态 变量 还 是 局 部 静态 变量 。 


2) 函数 返回 静态 变量 。 














3) 函数 中 调用 了 不 可 重 入 函数 。 














4) 函数 体内 使 用 了 静态 的 数据 结构 。 














5) 函数 体内 调用 了 malloc () 或 者 free () 函数 。 
































6) 函数 体内 调用 了 其 他 标准 MO 函数 。 





在 一 个 多 线程 程序 里 ， 默 认 情 况 下 ， 只 有 一 个 errno 变 量 供 所 有 的 线程 共享 。 在 一 个 线程 准备 获取 刚才 的 错误 代码 时 ， 该 变量 很 容易 被 另 一 个 线程 中 的 函数 调 

















的 函数 中 ， 这 些 函 数 通常 用 一 个 单独 的 全 局 性 区 域 来 缓存 输出 数据 。 









































为 解决 这 个 问题 ， 需 要 使 用 
的 任何 #include 语 句 之 前 。 





dj 














(3) _REENTRANT 为 我 们 做 三 件 事情 ， 并 且 做 得 非常 优雅 : 




















A 








2) stdio.h 中 原来 以 宏 的 形式 实现 的 一 些 函 数 将 变 成 可 安全 重 入 函数 。 














3) 在 error.h 中 定义 的 变量 error 现 在 将 成 为 一 个 函数 调用 ， 它 能 够 以 一 种 安全 的 多 线程 方式 来 获取 真正 的 errno 的 值 。 











9.6 “本章 小 结 


重 入 的 例 程 。 可 重 入 代码 可 以 被 多 次 调用 而 仍然 正常 工作 。 编 写 的 多 线程 程序 ， 通 过 定义 宏 REENTRANT 来 告诉 编译 器 需要 可 重 入 功能 ， 这 个 宏 的 定义 必须 出 现 了 





， 而 不 必 担心 数据 错误 的 函数 。 相 反 ，“ 不 可 重 入 函数 ” 则 是 只 能 


























稍 后 再 继续 运行 ， 且 不 会 丢失 数据 。 可 重 入 函数 要 在 使 用 本 地 























变量 或 


所 改变 。 类 似 的 问题 还 存在 于 fputs 之 类 


程序 中 





它 会 对 部 分 函数 重新 定义 它们 的 可 安全 重 入 的 版 本 ， 这 些 函 数 名 字 一 般 不 会 发 生 改变 ， 只 是 会 在 函数 名 后 面 添加 _r 字 符 串 ， 如 函数 名 gethostbyname 变 成 gethostbyname r. 


本 章 主 要 介绍 了 多 线程 的 使 用 ， 包 括 如 何 利用 各 种 同步 方式 ， 使 得 线程 安全 、 高 效 等 。 学 会 了 多 线程 ， 就 可 以 提高 应 用 程序 响应 ， 使 多 CPU 系统 更 加 有 效 并 改善 程序 结构 。 


前 面 提 到 的 进程 ， 相 关 用 法 将 在 第 10 章 详细 地 展开 。 


第 10 章 ”进程 


前 面 各 章 都 或 多 或 少 地 提 到 了 进程 ， 究 竟 进 程 是 什么 ” 进程， 是 计算 机 中 处 于 运行 中 程序 的 实体 。 以 前 ， 进 程 是 最 小 的 运行 单位 ; 有 了 线程 之 后 ， 线 程 成 为 最 小 的 运行 单位 ， 而 进程 则 是 线程 的 容器 。 
程序 本 身 只 是 指令 、 数 据 及 其 组 织 形式 的 描述 ， 进 程 才 是 程序 (指令 和 数据 ) 的 真正 运行 实例 。 多 个 进程 可 与 同一 个 程序 相关 联 ， 而 每 个 进程 则 是 以 同步 或 异步 的 方式 独立 运行 的 。 本 章 主 要 探讨 进程 的 相 
关内 容 。 


10.1 程序 与 进程 


先 来 看 下 Linux 的 进程 结构 ， 进 程 结构 一 般 由 3 部 分 组 成 : 代码 段 、 数 据 段 和 堆栈 段 。 代 码 段 是 用 于 存放 程序 代码 的 数据 ， 假 如 机 器 中 有 数 个 进程 运行 相同 的 一 个 程序 ， 那 么 它们 就 可 以 使 用 同一 个 代码 
段 。 而 数据 段 则 存放 程序 的 全 局 变量 、 常 量 和 静态 变量 。 堆 栈 段 中 的 栈 用 于 函数 调用 ， 它 存放 着 函数 的 参数 、 函 数 内 部 定义 的 局 部 变量 。 堆 栈 段 还 包括 了 进程 控制 块 (Process Control Block, PCB) 。 
PCB 处 于 进程 核心 堆栈 的 底部 ， 不 需要 额外 分 配 空间 。PCB 是 进程 存在 的 唯一 标识 ， 系 统 通过 PCB 的 存在 而 感知 进程 的 存在 。 系 统 通过 PCB 对 进程 进行 管理 和 调度 。 PCB 包 括 创建 进程 、 执 行程 序 、 退 出 进 
程 以 及 改变 进程 的 优先 级 等 。 








既然 进程 是 一 个 程序 的 执行 过 程 ， 那 么 程序 又 是 怎么 转化 为 进程 的 呢 ? 


一 般 情况 下 Linux 下 C++ 程 序 的 生成 可 分 为 4 个 阶段 : 预 编译 、 编 译 、 汇 编 、 链 接 。 编 译 嚣 g++ 经 过 预 编译 、 编 译 、 汇 编 3 个 步骤 将 源 程序 文件 转换 为 目标 文件 (第 4 章 有 如 何 生成 目标 文件 的 详细 过 程 ， 
有 和 需要 者 可 随时 翻阅 ) 。 如 果 程序 有 多 个 目标 文件 或 者 程序 使 用 了 库 函 数 ， 编 译 器 还 要 将 所 有 的 目标 文件 或 所 需要 的 库 链接 起 来 ， 最 后 形成 可 执行 程序 。 当 程序 执行 时 ， 操 作 系统 将 可 执行 程序 复制 到 内 存 
中 。 一 般 程序 转换 为 进程 分 以 下 几 个 步骤 : 


@ 内 核 将 程序 读 入 内 存 ， 为 程序 分 配 内 存 空间 ; 


@ 内 核 为 该 进程 分 配 进程 标识 符 (PID) 和 其 他 所 需 资源 ; 





@ 内 核 为 进程 保存 PID 及 相应 的 状态 信息 ， 把 进程 放 到 运行 队列 中 等 待 执行 ， 程 序 转化 为 进程 后 就 可 以 被 操作 系统 的 调度 程序 调度 执行 了 。 








每 个 进程 在 系统 中 都 有 唯一 的 一 个 ID 标识 它 ， 这 个 ID 就 是 进程 标识 符 (PID) 。 因 为 其 唯一 性 ， 所 以 系统 可 以 根据 它 准确 定位 到 一 个 进程 。 进 程 标识 符 的 类 型 为 pid_t， 其 本 质 上 是 一 个 无 符号 整 型 的 类 
型 别名 。 所 谓 程 序 ， 不 过 是 指 可 运行 的 二 进 制 代码 文件 ， 把 这 种 文件 加 载 到 内 存 中 运行 就 得 到 了 一 个 进程 。 同 一 个 程序 文件 可 以 被 加 载 多 次 成 为 不 同 的 进程 。 因 此 ， 进 程 与 进程 标识 符 之 间 是 一 对 一 的 关 
系 ， 而 与 程序 文件 之 间 是 多 对 一 的 关系 ， 如 图 10-1 所 示 。 


进程 标识 符 1 

















进程 标识 符 2 


进程 标识 符 3 











10-1 进程 标识 符 与 进程 、 程 序 之 间 的 关系 








10.2 ”进程 的 创建 与 结束 


进程 的 创建 有 两 种 方式 : 一 种 是 由 操作 系统 创建 ， 一 种 是 由 父 进程 创建 。 


在 系统 启动 时 ， 操 作 系统 会 创建 一 些 进程 ， 它 们 承担 着 管理 和 分 配 系统 资源 的 任务 ， 这 些 进程 通常 被 称 为 系统 进程 。 系 统 人 允许 一 个 进程 创建 新 进程 〈 即 为 子 进 程 ) ， 子 进程 还 可 以 创建 新 的 子 进程 ， 形 
成 进程 树 结构 。 整 个 Linux 系 统 的 所 有 进程 也 是 一 个 树 形 结构 。 树 根 是 系统 自动 构造 的 ， 即 在 内 核 态 下 执行 的 0 号 进程 ， 它 是 所 有 进程 的 祖先 。 由 0 号 进程 创建 1 号 进程 (内 核 态 ) ，1 号 负责 执行 内 核 的 部 分 
初始 化 工作 及 进行 系统 配置 ， 并 创建 若干 个 用 于 高 速 缓存 和 虚拟 贮存 管理 的 内 核 线程 。 随 后 ，1 号 进程 调用 execve () 运行 可 执行 程序 init， 并 演变 成 用 户 态 1 号 进程 ， 即 init 进 程 。 它 按照 配置 文 
件 /etc/initab 的 要 求 ， 完 成 系统 启动 工作 ， 创 建 编号 为 1 号 、2 号 .….. 的 若干 终端 注册 进程 getty。 每 个 getty 进 程 设置 其 进程 组 标识 号 ， 并 检测 配置 到 系统 终端 的 接口 线路 。 当 检测 到 来 自 终端 的 连接 信号 
时 ，getty 进 程 将 通过 函数 execve () 执行 注册 程序 login， 此 时 用 户 就 可 输入 注册 名 和 密码 进入 登录 过 程 ， 如 果 成 功 ， 由 login 程 序 再 通过 函数 execv () 执行 shell， 该 shell 进 程 接收 getty 进 程 的 pid， 取 代 
原来 的 getty 进 程 。 再 由 shell 直 接 或 间接 地 产生 其 他 进程 。 



































上 述 过 程 可 描述 为 : 0 号 进程 一 > 1 号 内 核 进程 一 > 1 号 内 核 线程 一 > 1 号 用 户 进程 (init 进 程 ) 一 >getty 进 程 一 >shell 进 程 。 
注意 ， 上 述 过 程 描述 中 提 到 : 1 号 内 核 进 程 调 用 执行 init 并 演变 成 1 号 用 户 态 进 程 (init 进 程 ) ， 这 里 前 者 是 init 是 函数 ， 后 者 是 进程 。 两 者 容易 混淆 ， 区 别 如 下 所 述 。 
(1) init () 函数 在 内 核 态 运行 ， 是 内 核 代 码 。 


(2) init 进 程 是 内 核 启动 并 运行 的 第 一 个 用 户 进程 ， 运 行 在 用 户 态 下 。 


























(3) init () 函数 调用 execve () 从 文件 /etc/inittab 中 加 载 可 执行 程序 init 并 执行 ， 这 个 过 程 并 没有 使 用 调用 do_fork () ， 因 此 两 个 进程 都 是 1 号 进程 。 


1. 进 程 的 创建 一 一 fork () 函数 















































Linux 系 统 允 许 任何 一 个 用 户 进 程 创 建 一 个 子 进程 ， 创 建成 功 后 ， 子 进程 将 存在 于 系统 之 中 ， 并 且 独 立 于 父 进程 。 该 子 进程 可 以 接受 系统 调度 ， 可 以 得 到 分 配 的 系统 资源 。 系 统 也 可 以 检测 到 子 进程 的 存 























在 ， 并 且 赋 予 它 与 父 进程 同样 的 权利 。 

















Linux 系 统 下 使 用 fork () 函数 创建 一 个 子 进程 ， 其 函数 原型 如 下 : 




















#include <unistd.h> 
pid t fork (void); 


























在 讨论 fork () 函数 之 前 ， 有 必要 先 明确 父 进程 和 子 进程 两 个 概念 。 除 了 0 号 进程 (该 进程 是 系统 
程 ， 即 调用 fork () 函数 的 进程 就 是 父 进程 ， 而 新 创建 的 进程 就 是 子 进 程 。 












































fork () 函数 不 需要 参数 ， 返 





回 





值 是 一 个 进程 标识 符 (PID) 。 对 于 








值 ， 有 以 下 3 种 情况 。 


T 
Kí 
回 








(1) 对 于 父 进程 ，fork () 函数 返回 新 创建 的 子 进程 的 ID。 




















(2) 对 于 子 进程 ，fork () 函数 返回 0。 











(3) 如 果 创 建 出 错 ， 则 fork () 函数 返回 -1。 











fork () 函数 会 创建 一 个 新 的 进程 ， 并 从 内 核 中 为 此 进程 分 配 一 个 新 的 可 用 的 进程 标识 符 (PID) , 














举 时 由 系统 创建 的 ) 以 外 ，Linux 系 统 中 的 任何 一 个 进程 都 是 由 其 他 进程 创建 的 。 创 建新 进程 的 进 








之 后 ， 为 这 个 新 进程 分 配 进程 空间 ， 并 将 父 进程 的 进程 空间 中 的 内 容 复制 到 子 进程 的 进程 空间 中 ， 包 


括 父 进程 的 数据 段 和 堆栈 段 ， 并 且 和 父 进程 共享 代码 段 。 这 时 候 ， 系 统 中 又 多 了 一 个 进程 ， 这 个 进程 和 父 进程 一 模 一 样 ， 两 个 进程 都 要 接受 系统 的 调度 。 由 于 在 复制 时 复制 了 父 进 程 的 堆栈 段 ， 所 以 两 个 进 





程 都 停留 在 了 fork () 函数 中 ， 等 待 返 回 。 





回 























下 面 给 出 的 示例 程序 例 10.1 用 来 创建 一 个 子 进程 ， 该 程序 在 父 进程 和 子 进程 中 分 别 输出 不 同 的 内 容 。 














【 例 10.1】 ”创建 一 个 子 进程 。 


#include<stdio.h> 
#include<stdlib.h> 
#include<unistd.h> 
int main (void) { 
pid t pid; 
pid= fork(); 
if (pid < 0){ 
perror ("fail to fork"); 
exit (-1); 
l 
else if (pid == 0){ 
/* 子 进程 */ 
printf("Sub-process, PID: $u, PPID: $uWM", getpid(), getppid()); 
} 
else{/* 父 进程 */ 
printf("Parent, PID: $u, Sub-process PID: $uWn", getpid(), pid); 
sleep(2); 


return 0; 





程序 的 执行 结果 如 图 10-2 所 示 。 
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Ut, fork () 函数 会 返回 两 次 ， 一 次 是 在 父 进程 中 返回 ， 另 一 次 是 在 子 进程 中 返回 ， 这 两 次 的 返回 值 是 不 一 样 的 。 





图 10-2” 例 10.1 程 序 的 执行 结果 





由 于 创建 的 新 进程 和 父 进程 在 系统 看 来 是 地 位 平等 的 两 个 进程 ， 运 行 机 会 也 是 一 样 的 ， 故 不 能 够 对 其 执行 先后 顺序 进行 假设 ， 先 执行 哪 一 个 进程 取决 于 系统 的 调度 算法 。 例 10.1 中 为 了 让 父 进程 不 那么 
快 结束 ， 所 以 加 了 sleep (2) 语句 ， 休 眠 2s 再 结束 。 这 样 方便 读者 看 到 父子 进程 的 关系 。getpid () 是 获得 当前 进程 的 pid， 而 getppid () 则 是 获得 父 进 程 的 id。 


那么 父 进程 和 子 进程 都 共享 了 哪些 资源 呢 ? 例 10.2 即 解答 了 这 个 问题 。 


【 例 10.2】 ”父子 进程 的 共享 资源 。 





#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
int global = 1; /* 初 始 化 的 全 局 变量 ， 存 在 data 段 x/ 
int main (void) { 
pid t pid; /* 存 储 进程 dx/ 
int stack = 1;/* 局 部 变量 ， 存 在 栈 中 */ 
int *heap;/* 指 向 堆 变 量 的 指针 */ 
heap = (int *)malloc (sizeof (int)); 
*heap = 3;/* 设 置 堆 中 的 值 是 3*/ 
pid = fork() ;/* 创 建 一 个 新 的 进程 */ 
if (pid < 0){ 
perror ("fail to fork"); 
exit(-1); 
l 
else if (pid == 0){ 
/* 子 进程 ， 改 变 变 量 的 值 */ 
globalt*; 
stacktt; 
(*heap) ++; 
/* 打 印 出 变量 的 值 */ 





printf("In sub-process, global: $d, stack: $d, heap: %d\n", global, stack, *heap); 


exit(0); 
} 
else( 
/* 父 进程 */ 
sleep (2) ;/* 休 眠 2 秒 钟 ， 确 保 子 进 程 已 执行 完毕 ， 再 执行 父 进 程 */ 


printf("In parent-process, global: $d, stack: $d, heap: %d\n", global, stack, *heap); 


return 0; 








程序 的 执行 结果 如 图 10-3 所 示 。 
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图 10-3 ” 例 10.2 程 序 的 执行 结果 











例 10.2 中 定义 了 一 个 全 局 变量 global、 一 个 局 部 变量 stack 和 一 个 指针 heap。 该 指针 用 来 指向 一 块 动态 分 配 的 内 存 区 域 。 之 后 ， 该 程序 创建 一 个 子 进程 ， 在 子 进程 中 修改 global、stack 和 动态 分 配 的 内 
存 中 变量 的 值 。 然 后 在 父 、 子 进程 中 分 别 打印 出 这 些 变 量 的 值 。 由 于 父 、 子 进程 的 运行 顺序 是 不 确定 的 ， 因 此 可 以 先 让 父 进程 额外 休眠 2s， 以 保证 子 进程 先 运行 。 





























由 于 父 进程 休眠 了 2s， 子 进程 先 于 父 进 程 运行 ， 因 此 会 先 在 子 进程 中 修改 数据 段 和 堆栈 段 中 的 内 容 。 因 此 不 难看 出 ， 子 进程 对 这 些 数据 段 和 堆栈 段 中 内 容 的 修改 并 不 会 影响 到 父 进程 的 进程 环境 。 























事实 上 ， 子 进程 完全 复制 了 父 进程 的 地 址 空间 的 内 容 ， 包 括 堆栈 段 和 数据 段 的 内 容 。 但 是 ， 子 进程 并 没有 复制 代码 段 ， 而 是 和 父 进程 共用 代码 段 。 这 样 做 是 合理 的 ， 因 为 子 进程 可 能 执行 不 同 的 流程 来 
改变 数据 段 和 堆栈 段 ， 因 此 需要 分 开 存 储 父子 进程 各 自 的 数据 段 和 堆栈 段 。 但 是 代码 段 是 只 读 的 ， 不 存在 被 修改 的 问题 ， 因 此 代码 段 可 以 让 父子 进程 共享 ， 以 节省 存储 空间 ， 如 图 10-4 所 示 。 





























父 进程 的 数据 段 


进程 : EP [Cad Ez t 


系统 中 的 其 他 数据 


子 进 程 的 代码 段 ( 指 问 父 
进程 的 代码 段 ) 





图 10-4 ”父子 进程 公用 代码 段 
父 进程 的 资源 大 部 分 被 fork () 函数 所 复制 ， 只 有 小 部 分 是 子 进程 与 父 进 程 不 同 的 。 子 进程 继承 的 资源 情况 如 表 10-1 所 示 。 


表 10-1 子 进 程 继 承 资源 的 情况 


资源 父子 进程 是 否 相同 
AER ID 是 
实际 用 户 人 | X | 是 
有 效用 户 人 D | 是 | 是 





资源 3 


H 
RE 
Iti 
fa 
D 
uh 
可 
H 
RE 
pi 
niu 
I 
H5 
可 








进程 组 ID 是 是 
父 进程 D T 连接 的 共享 存储 自 是 
会 话 ID 是 存储 映射 是 

是 是 


设置 用 户 ID 标志 


资源 限制 








设置 组 ID 标志 是 tms_utime 否 
当前 工作 目录 是 tms stime f 
HR Bs 是 tms cutime f 
文件 权限 屏蔽 字 是 tms ustime d 
信号 的 屏蔽 是 for 函数 的 返回 值 f 
打开 的 文件 描述 符 是 设置 的 文件 锁 ff 
数据 段 是 未 处 理 的 闹钟 信号 否 
代码 段 是 未 决 信号 集 否 
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现在 的 Linux 内 核 在 实现 fork () 函数 时 往往 在 创建 子 进 程 时 并 不 立即 复制 父 进程 的 数据 段 和 堆栈 段 ， 而 是 当 子 进程 修改 这 些 数据 内 容 时 复制 操作 才 会 发 生 ， 内 核 才 会 给 子 进 程 分 配 进 程 空间 ， 将 父 进程 
的 内 容 复 制 过 来 ， 然 后 继续 后 面 的 操作 。 这 样 的 实现 更 加 合理 ， 对 于 一 些 只 是 为 了 复制 自身 完成 一 些 工 作 的 进程 来 说 ， 这 样 做 的 效率 会 更 高 。 这 也 是 现代 操作 系统 中 一 个 重要 的 概念 一 一 “ 写 时 复制 ”的 一 
重要 体现 。 
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2. 进 程 的 结束 一 一 exit () 函数 























当 一 个 进程 需要 退出 时 ， 需 要 调用 退出 函数 。Linux 环 境 下 使 用 exit () 函数 退出 进程 ， 其 函数 原型 如 下 : 





























fincludecstdlib.h» 
void exit(int status); 





exit () 函数 的 参数 表示 进程 的 退出 状态 ， 这 个 状态 的 值 是 一 个 整 型 ， 保 存在 全 局 变量 $? 中 。 





Linux 程 序 员 可 以 通过 shell 得 到 已 结束 进程 的 结束 状态 ， 执 行 “echo$? ”命令 即 可 。 

















$? 是 Linux shell 中 的 一 个 内 置 变量 ， 其 中 保存 的 是 最 近 一 次 运行 的 进程 的 返回 值 。 这 个 返回 值 有 以 下 3 种 情况 : @ 程 序 中 的 main 函 数 运行 结束 ，$? 中 保存 main 函 数 的 返回 值 ; @ 程 序 运行 中 调用 exit 
函数 结束 运行 ，$? 中 保存 exit 函 数 的 参数 ;@@ 程 序 异常 退出 ，$? 中 保存 异常 出 错 的 错误 号 。 









































下 面 的 程序 用 来 测试 程序 的 结束 状态 ， 该 程序 接收 整 型 输入 ， 如 果 输 入 数字 0 则 正常 退出 。 








【 例 10.3】 M$? 获得 进程 的 返回 值 。 





#include <iostream> 
int main (){ 
int i; 
while (1)( 
std::cin»»i; 


return 10; 


l 





程序 执行 结果 如 图 10-5 所 示 。 
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图 10-5” 例 10.3 程 序 的 执行 结果 























注意 : 首先 ，shell 内 置 变 量 $? 保存 的 是 最 近 一 次 运行 的 进程 的 返回 值 ， 所 以 使 用 时 需要 确保 在 打印 需要 的 进程 返回 值 前 没有 其 他 的 操作 ， 同 时 应 该 避免 后 台 进 程 的 干扰 。 其 次 ， 在 运行 程序 时 ， 如 果 
程序 运行 出 错 ， 比 如 shell 找 不 到 指定 的 进程 ， 那 么 $? 内 置 变量 中 的 值 是 1。 






































所 以 ， 在 编写 代码 时 如 果 没 有 出 错 ， 则 不 要 使 main 函 数 的 返回 值 为 1， 或 者 使 用 exit (1) 这 样 的 写法 ,以免 引起 混乱 。 




















(1) 继续 回 到 在 Linux 中 如 何 让 一 个 进程 退出 (进程 退出 表示 进程 即将 结束 ) ， 在 Linux 中 进程 退出 分 为 正常 退出 和 异常 退出 两 种 。 
1) 正常 退出 。 


@ 在 main () 函数 中 执行 return 











@ 调 用 exit () 函数 ; 











@ 调 用 exit () 函数 。 























@ 调 用 abort 函 数 ; 





@ 进 程 收 到 某 个 信和 号， 而 该 信号 使 程序 终止。 


























不 管 是 哪 种 退出 方式 ， 系 统 最 终 都 会 执行 内 核 中 的 同一 代码 。 这 段 代 码 用 来 关闭 进程 所 用 已 打开 的 文件 描述 符 ， 释 放 它 所 占用 的 内 存 和 其 他 资源 。 



































(2) 以 上 几 种 退出 方式 的 不 同 点 : 
1) exit 和 return 的 区 别 。 


@exit 是 一 个 函数 ， 带 有 参数 ，exit 执 行 完 后 把 控制 权 交 给 系统 ; 








@Oreturn 是 函数 执行 完 后 的 返回 ，return 执 行 完 后 把 控制 权 交 给 调用 函数 。 











2) exit 和 abort 的 区 别 。 


Q@exit 是 正常 终止 进程 ; 





@abort 是 异常 终止 。 





(3) 现在 我 们 重点 了 解 exit () 和 _exit () 函数 。 














1) exit 和 _exit 函 数 都 是 用 来 终止 进程 的 。 











当 程 序 执行 到 exit 或 _ exit 时， 系统 无 条 件 地 停止 剩 下 所 有 操作 ， 清 除 包括 PCB 在 内 的 各 种 数据 结构 ， 并 终止 本 进程 的 运行 。 











2) exit () 是 在 头 文件 stdlib.h 中 声明 ， 而 exit () 声明 在 头 文件 unistd.h 中 声明 。exit 中 的 参数 exit_code 为 0 时， 代表 进程 正常 终止 ， 若 为 其 他 值 ， 表 示 程 序 执行 过 程 中 有 错误 发 生 。 








并 且 exit () 执行 后 立即 返回 给 内 核 ， 而 exit () 要 先 执行 一 些 清除 操作 ， 然 后 将 控制 权 交 给 内 核 。 





























在 调用 _exit 函 数 时 ， 其 会 关闭 进程 所 有 的 文件 描述 符 ， 清 理 内存 以 及 其 他 一 些 内 核 清理 函数 ， 但 不 会 刷新 流 (stdin, stdout, stderr...) 的 数据 。exit 函 数 是 在 exit 函数 之 上 的 一 个 封装 ， 
_exit， 并 在 调用 之 前 先 刷新 流 数据 。 








会 自动 调 

































































3) exit () 函数 与 exit () 函数 最 大 区 别 就 在 于 exit () 函数 在 调用 exit 系 统 之 前 要 检查 文件 的 打开 情况 ， 把 文件 缓冲 区 的 内 容 写 回 文件 。 由 于 Linux 的 标准 函数 库 中 ， 有 一 种 被 称 作 “ 缓 冲 /O” 的 操 
作 ， 其 特征 就 是 对 应 每 一 个 打开 的 文件 ， 在 内 存 中 都 有 一 片 缓冲 区 。 每 次 读 文件 时 ， 会 连续 的 读 出 若干 条 记录 ， 这 样 在 下 次 读 文件 时 就 可 以 直接 从 内 存 的 缓冲 区 中 读 取 ; 同样 ， 每 次 写 文件 的 时 候 也 仅仅 是 
写 入 内 存 的 缓冲 区 ， 等 满足 了 一 定 的 条 件 (如 达到 了 一 定数 量 或 遇 到 特定 字符 等 ) 后 ， 再 将 缓冲 区 中 的 内 容 一 次 性 写 入 文件 。 这 种 技术 大 大 增加 了 文件 读 写 的 速度 ， 但 也 给 编程 带 来 了 一 点 儿 麻烦 。 比 如 有 
一 些 数据 ， 理 论 上 应 该 已 经 写 入 了 文件 ， 但 实际 上 因为 没有 满足 特定 的 条 件 ， 它 们 还 只 是 保存 在 缓冲 区 内 ， 这 时 如 果 用 _exit () 函数 直接 将 进程 关闭 ， 缓 冲 区 的 数据 就 会 丢失 。 因 此 ， 要 想 保 证 数据 的 完整 
性 ， 就 一 定 要 使 用 exit () 函数 。 









































































































































下 面 通过 一 个 函数 实例 来 看 看 它们 之 间 的 区 别 。 





【 例 10.4】 ”exit 和 _exit 函 数 的 区 别 。 





exit.cpp 的 代码 是 : 


#include <stdio.h> 

#include «stdlib.h» 

int main(){ 
printf ("using exit.\n"); 
printf ("This is the content in buffer"); 
exit(0); 

} 


_exit.cpp 的 代码 是 : 


#include «stdio.h» 

#include <unistd.h> 

int main(){ 
printf ("using _exit.\n"); 
printf ("This is the content in buffer"); 
_exit (0); 


} 





程序 的 执行 结果 如 图 10-6 所 示 。 
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图 10-6” 例 10.4 程 序 的 执行 结果 




















exit.cpp 和 _exit.cpp 中 ， 只 有 exit (0) ; 和 _exit (0) ; 不 一 样 ; 其 中 的 printf 函 数 就 是 使 用 缓冲 MO 的 方式 ， 该 函数 在 遇 到 “\n” 换 行 符 时 自动 的 从 缓冲 区 中 将 记录 读 出 。 程 序 执行 结果 显 
zn, exit () 会 将 缓冲 区 的 数据 写 完 后 才 退 出 ， 而 _exit () 函数 直接 退出 。 



























































假如 把 例 10.1 中 的 sleep (2) 这 行 代码 注释 掉 ， 会 有 可 能 出 现 如 图 10-7 所 示 的 执行 结果 
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图 10-7 例 10.1 程 序 去 挤 休 有 眠 2s 后 的 执行 结果 





也 就 是 ， 子 进程 在 打印 父 进程 pid 时 ， 发 现 父 进程 pid 的 值 是 1， 和 前 面 打 印 的 父 进程 pid 值 不 一 致 ， 这 是 为 什么 呢 ? 





在 UNIX/Linux 中 ， 正 常情 况 下 ， 子 进程 是 通过 父 进程 创建 的 ， 子 进程 在 创建 新 的 进程 。 子 进程 的 结束 和 父 进 程 的 运行 是 一 个 异步 过 程 ， 即 父 进程 永远 无 法 预测 子 进程 到 底 什么 时 候 结束 。 于 是 就 产生 了 
孤儿 进程 和 僵尸 进程 。 











孤儿 进程 ， 是 指 一 个 父 进 程 退出 后 ， 而 它 的 一 个 或 多 个 子 进 程 还 在 运行 ， 那 么 那些 子 进程 将 成 为 孤儿 进程 。 孤 儿 进 程 将 被 init 进 程 (进程 号 为 1) 所 收养 ， 并 由 init 进 程 对 它们 完成 状态 收集 工作 。 

















僵尸 进程 ， 是 指 一 个 进程 使 用 fork 创 建 子 进程 ， 如 果子 进程 退出 ， 而 父 进程 并 没有 调用 wait 或 waitpid 获 取 子 进程 的 状态 信息 ， 那 么 子 进程 的 进程 描述 符 仍然 保存 在 系统 中 ， 这 种 进程 称 为 僵尸 进程 。 当 
一 个 进程 完成 它 的 工作 终止 之 后 ， 它 的 父 进程 需要 调用 wait () 或 者 waitpid () 系统 调用 取得 子 进程 的 终止 状态 。 







































































可 以 这 样 理解 孤儿 进程 和 僵尸 进程 的 区 别 : 孤儿 进程 是 父 进程 已 退出 ， 而 子 进程 未 退出 ;僵尸 进程 是 父 进 程 未 退出 ， 而 子 进程 已 退出 。 





o 








根据 上 面 的 描述 ， 可 以 这 样 来 写 一 个 僵尸 进程 。 





写 一 个 僵尸 进程 。 





#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 
int main(){ 
/*fork 一 个 子 进程 */ 
pid t pid = fork(); 
if (pid > 0){/* 父 进程 */ 
printf("in parent process, sleep for one miniutehttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...zZhttp://www. 
sleep(3); 
printf ("after sleeping, and exit! Wn"); 
l 
else if(pid = O)( 
/* 子 进程 退出 ， 成 为 一 个 僵尸 进程 */ 
printf("in child process, and exit!\n"); 
exit(0); 
l 


return 0; 








程序 的 执行 结果 如 








10-8 所 示 。 
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Ej10-8 ” 例 10.5 程 序 的 执行 结果 








此 在 子 进程 退出 之 后 变 成 僵尸 进程 。 在 程序 运行 期 间 ， 如 果 打 开 另 一 个 终端 ， 执 行 ps aux|grep-w'Z' 命 令 ， 可 以 得 

















父 进程 中 休眠 3s， 让 子 进程 先 退 出 。 而 且 ， 父 进程 并 没有 写 wait 等 系统 调用 函数 
到 如 图 10-9 所 示 的 结果 。 





























图 10-9 有 僵尸 进程 时 用 Ps 命令 可 以 看 到 的 结果 




















从 上 面 可 以 看 出 ， 系 统 中 多 了 一 个 僵尸 进程 。 但 如 果 等 父 进程 睡眠 醒 来 并 退出 之 后 ， 再 次 查看 系统 进程 信息 ， 会 发 现 刚才 的 僵尸 进程 不 见 了 ， 如 图 10-10 所 示 。 因 为 ， 父 进程 退出 后 ， 这 个 僵尸 进程 已 
成 为 孤儿 进程 ， 过 继 给 了 init 进 程 ， 而 init 进 程 会 周期 性 地 调用 wait 系 统 调用 来 清除 各 个 僵尸 的 子 进程 。 
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图 10-10 ”没有 僵尸 进程 时 用 ps 命令 可 以 看 到 的 结果 








既然 wait 函 数 可 以 回收 子 进程 ， 那 我 们 来 看 下 怎么 使 


n 
































进程 一 旦 调用 了 wait 函 数 ， 就 立即 阻塞 自己 ， 由 wait 自 动 分 析 是 否 当前 进程 的 某 个 子 进程 已 经 退出 ， 如 果 让 它 找到 了 这 样 一 个 已 经 变 成 僵尸 的 子 进程 ，wait 就 会 收集 这 个 子 进程 的 信息 ， 并 把 它 彻底 销 
毁 后 返回 ; 如果 没有 找到 这 样 一 个 子 进程 ，wait 就 会 一 直 阻 塞 在 这 里 ， 直 到 有 一 个 出 现 为 止 。 














头 文件 为 : 


#include<sys/types.h> 
#include<sys/wait.h> 


pid t wait (int * status); 




















wait () 会 暂时 停止 目前 进程 的 执行 ， 直 到 有 信号 来 到 或 子 进程 结束 。 如 果 在 调用 wait () 时 子 进 程 已 经 结束 ， 则 wait () 会 立即 返回 子 进程 结束 状态 值 。 子 进程 的 结束 状态 值 会 由 参数 status 返 
而 子 进程 的 进程 识别 码 也 会 一 快 返回 。 如 果 不 需 要 结束 状态 值 ， 则 参数 status 可 以 设 成 NULL。 











回 

















如 果 执 行 成 功 则 返回 子 进程 识别 码 (PID) ; 如 果 有 错误 发 生 则 返回 -1， 并 将 失败 原因 存 于 errno 中 。 














【 例 10.6】 ”使 用 wait 函 数 回 收 子 进程 。 


























#include <sys/types.h> 
#include <sys/wait.h> 
#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
int main (){ 
/*fork 一 个 子 进程 */ 
pid t pid = fork(); 
if (pid«0)( 
perror ("fork error\n"); 
return 0; 
Jelse if(pid > 0) {/* 父 进程 */ 
printf ("Parent process\n"); 
pid t pr-wait (NULL); 
printf ("Parent process, I catched a child process with pid of $dWn",pr); 
Jelse if(pid == 0){ 
printf("Sub-process, PID: $u, PPID: $uW", getpid(), getppid()); 
exit(0); 


return 0; 








程序 的 执行 结果 如 图 10-11 所 示 。 
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图 10-11 ” 例 10.6 程 序 的 执行 结果 














例 10.6 中 ， 父 进程 只 负责 回收 退出 的 子 进程 信息 ， 而 子 进程 也 只 打印 了 一 行 提示 信息 。 如 果 参 数 status 的 值 不 是 NULL，wait 就 会 把 子 进程 退出 时 的 状态 取出 并 存 入 其 中 ， 这 是 一 个 整数 值 (int) ， 指 出 
了 子 进程 是 正常 退出 还 是 被 非 正 常 结束 的 ， 以 及 正常 结束 时 的 返回 值 或 被 哪 一 个 信号 结束 的 等 信息 。 由 于 这 些 信息 被 存放 在 一 个 整数 的 不 同 二 进 制 位 中 ， 所 以 用 常规 的 方法 读 取 会 非常 麻烦 ， 人 们 就 设计 了 
一 套 专 门 的 宏 (macro) 来 完成 这 项 工作 ， 下 面 介绍 其 中 最 常用 的 两 个 : WIFEXITED (status) ， 这 个 宏 用 来 指出 子 进程 是 否 为 正常 退出 的 ， 如 果 是 ， 它 会 返回 一 个 非 零 值 ， 注 意 ， 虽 然 名 字 一 样 ， 这 里 
的 参数 status 并 不 同 于 wait 函 数 中 的 status 参 数 ， 而 是 那个 指针 所 指向 的 整数 ， 切 记 不 要 搞 混 了 ; @WEXITSTATUS (status) ， 当 WIFEXITED 返 回 非 零 值 时 ， 可 以 用 这 个 宏 来 提取 子 进 程 的 返回 值 ， 如 果子 
进程 调用 exit (5) 退出 ，WEXITSTATUS (status) 就 会 返回 5， 如 果子 进程 调用 exit (7) , WEXITSTATUS (status) 就 会 返回 7。 请 注意 ， 如 果 进 程 不 是 正常 退出 的 ， 也 就 是 说 ，WIFEXITED 返 回 0， 这 个 
值 就 毫 无 意义 。 
























































































































































【 例 10.7】 ”利用 WEXITSTATUS 获 得 子 进程 的 返回 码 。 











#include <sys/types.h> 
#include <sys/wait.h> 
#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
int main(){ 


/*fork 一 个 子 进程 */ 


pid t pid = fork(); 
if (pid«0)( 
perror("fork error\n"); 
return 0; 
Jelse if(pid > 0) (/* st */ 
printf ("Parent process\n"); 
int status=-1; 
pid t pr=wait (&status) ; 
if (WIFEXITED (status) ) { 
printf ("the child process $d exit normally.\n",pr); 
printf("the return code is $d. Mn",WEXITSTATUS (status)); 
Jelse( 
printf("the child process $d exit abnormally.Wn",pr); 
} 
Jelse if(pid == 0){ 
printf("Sub-process, PID: $u, PPID: $uW", getpid(), getppid()); 
exit(3); 


return 0; 





程序 的 执行 结果 如 图 10-12 所 示 。 
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图 10-12” 例 10.7 程 序 的 执行 结果 





父 进 程 准确 捕捉 到 了 子 进程 的 返回 值 为 3， 并 把 它 打印 了 出 来 。 如 果 在 子 进程 中 再 休眠 10s， 会 发 现 父 进程 也 在 继续 等 下 去 ， 只 有 子 进程 从 休 眼 程序 中 退出 ， 它 才能 退出 ， 才 能 父 进程 捕捉 到 。 读 者 如 果 
兴趣 的 话 ， 可 以 自己 给 子 进程 加 上 休眠 ， 看 看 会 出 现 怎样 的 结果 。 




















讲 到 wait 函 数 ， 一 定 会 聊 到 waitpid 函 数 。 从 本 质 上 讲 ，waitpid 是 wait 的 封装 ，waitpid 只 是 多 出 了 两 个 可 由 用 户 控制 的 参数 pid 和 options， 为 编程 提供 了 灵活 性 。 

















使 用 时 必须 包括 的 头 文件 : 











#include<sys/types.h> 
#include<sys/wait.h> 





pid t waitpid(pid t pid,int * status,int options); 






































waitpid () 会 暂时 停止 目前 进程 的 执行 ， 直 到 有 信号 来 到 或 子 进程 结束 。 如 果 在 调用 waitpid () 时 子 进 程 已 经 结束 ， 则 waitpid () 会 立即 返回 子 进程 结束 状态 值 。 子 进程 的 结束 状态 值 会 由 参数 
status 返 回 ， 而 子 进程 的 进程 识别 码 也 会 一 起 返回 。 如 果 不 在 意 结束 状态 值 ， 则 参数 status 可 以 设 成 NULL。 


























(1) 参数 pid 为 欲 等 待 的 子 进程 识别 码 ， 其 他 数值 意义 如 下 所 述 。 





1) pid<-1: 等 待 进程 组 识别 码 为 pid 绝 对 值 的 任何 子 进程 。 


2) pid=-1: 等 待 任何 子 进程 ， 相 当 于 wait。 











3) pid=0: 等 待 进程 组 识别 码 与 目前 进程 相同 的 任何 子 进程 。 














D 


pid>0: 等 待 任何 子 进程 识别 码 为 pid 的 子 进 程 。 


(2) 参数 options 的 值 有 以 下 几 种 类 型 。 








A 


options=WNOHANG， 即 使 没有 子 进 程 退 出 ， 它 也 会 立即 返回 ， 不 会 像 wait 那 样 永远 等 下 去 。 


2) options=WUNTRACED， 则 子 进程 进入 暂停 则 马上 有 返回， 但 结束 状态 不 予以 理会 。 
































Linux 中 只 支持 WNOHANG 和 WUNTRACED 两 个 选项 ， 这 是 两 个 常数 ， 可 以 用 “| ”运算 符 把 它们 连接 起 来 使 用 ， 比 如 : 


ret-waitpid(-1,NULL,WNOHANG | WUNTRACED); 











如 果 不 想 使 用 它们 ， 也 可 以 把 options 设 为 0， 如 : 








ret-waitpid (-1, NULL, 0) ; 


(3) waitpid 的 返回 值 如 下 所 述 。 





1) 当 正 常 返 回 的 时 候 waitpid 返 回收 集 到 的 子 进 程 的 进程 ID。 

















2) 如 果 设 置 了 选项 WNOHANG， 而 调用 中 waitpid 发 现 没有 已 退出 的 子 进程 可 收集 ， 则 返回 0。 























3) 如 果 调 用 中 出 错 ， 则 返回 -1， 这 时 errno 会 被 设置 成 相应 的 值 以 指示 错误 所 在 。 
































4) 当 piqd 所 指示 的 子 进程 不 存在 ， 或 此 进程 存在 ， 但 不 是 调用 进程 的 子 进程 ，waitpid 就 会 出 错 返回 ， 这 时 errno 被 设置 为 ECHILD。 








如 何 使 用 waitpid 函 数 收集 子 进程 信息 。 














#include <sys/types.h> 
#include <sys/wait.h> 
#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
int main(){ 
pid t pid, pr; 
pid-fork(); 
if (pid<0) /* 如 果 fork 出 错 */ 
printf ("Error occured on forking.\n"); 
else if(pid--0)( /* 如 果 是 子 进程 */ 
printf("Sub process will sleep for 10 seconds.\n") 
sleep(10); /* 睡眠 10 秒 */ 
exit(0); 
}else if (pid>0){ 
/* 如 果 是 父 进程 */ 
dot 
pr-waitpid(pid, NULL, WNOHANG); 
/* 使 用 了 WNOHANG 参 数 ，waitpid 不 会 在 这 里 等 待 */ 
if (pr==0) { /* 如 果 没 有 收集 到 子 进程 */ 
printf("No child exitedWin"); 


sleep(1); 
} 
jwhile (pr==0); /* 没有 收集 到 子 进程 ， 就 回去 继续 尝试 */ 
if(pr--pid) 
printf ("successfully get child $dWn", pr); 


else 
printf ("some error occuredWn"); 
l 


return 0; 





程序 的 执行 结果 如 图 10-13 所 示 。 
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图 10-13” 例 10.8 程 序 的 执行 结果 





父 进 程 经 过 10 次 失败 的 尝试 之 后 ， 终 于 收集 到 了 退出 的 子 进程 。 因 为 这 只 是 一 个 例子 程序 ， 不 便 写 得 太 复杂 所 以 就 让 父 进程 和 子 进程 分 别 休 眠 10s 和 1s， 代 表 它们 分 别 作 了 10s 和 1s 的 工作 。 父 子 进程 
都 有 工作 要 做 ， 父 进程 利用 工作 的 简短 间歇 查看 子 进程 的 是 否 退出 ， 如 退出 就 收集 它 。 




















在 Linux 或 者 UNIX 操 作 系统 中 在 系统 的 引导 的 时 候 会 开启 很 多 服务 ， 这 些 服务 就 叫 作 守 护 进 程 。 为 了 增加 灵活 性 ，root 可 以 选择 系统 开启 的 模式 ， 这 些 模式 叫 作 运行 级 别 ， 每 一 种 运行 级 别 以 一 定 的 方 
式 配置 系统 。 








守护 进程 是 脱离 于 终端 并 且 在 后 台 运 行 的 进程 。 守 护 进程 脱离 于 终端 是 为 了 避免 进程 在 执行 过 程 中 的 信息 在 任何 终端 上 显示 并 且 进 程 也 不 会 被 任何 终端 所 产生 的 终端 信息 所 打 断 。 





守护 进程 是 一 个 生存 期 较 长 的 进程 ， 通 常 独立 于 控制 终端 并 且 周 期 性 地 执行 某 种 任务 或 等 待 处 理 某 些 发 生 的 导 
程 ， 大 多 数 服务 都 是 通过 守护 进程 实现 的 ， 同 时 ， 守 护 进 程 还 能 完成 许多 系统 任务 ， 例 如 作业 规划 进程 crond、 打 印 进程 qd 等 (这 里 的 结 


由 于 在 Linux 中 ， 每 一 个 系统 与 用 户 进行 交流 的 界面 称 为 终端 ， 每 一 个 从 此 终端 开始 运行 的 进程 都 会 依附 了 
关闭 。 但 是 守护 进程 却 能 够 突破 这 种 限制 ， 它 从 被 执行 时 开始 运转 ， 直 到 整个 系统 关闭 时 才 退 出 。 如 果 想 让 某 个 进程 不 因为 


程 。 
































创建 一 个 简单 的 守护 进程 的 步骤 如 下 所 述 。 


这 是 编写 守护 进程 的 第 一 步 。 由 于 守护 进程 是 脱离 控制 终端 的 ， 








(1) 创建 子 进 程 ， 父 进程 退出 。 





执行 其 他 命令 ， 从 而 在 形式 上 做 到 了 与 控制 终端 的 脱离 。 


在 Linux 中 如 果 父 进程 先 于 子 进程 退出 会 造成 子 进程 成 为 孤儿 进程 ， 而 每 当 系 统 发 现 一 个 孤儿 进程 时 ， 就 会 





(2) 在 子 进程 中 创建 新 会 话 。 








这 个 步骤 是 创建 守护 进程 中 最 重要 的 一 步 ， 虽 然 它 的 实现 非常 简单 ， 但 它 的 意义 却 非常 


1 


进程 组 : 是 一 个 或 多 个 进程 的 集合 。 进 程 组 由 











ID, 








有 件 。 守护 进程 常常 在 系统 引导 装 入 时 启动 ， 在 系统 关闭 时 终止 。Linux 系 统 有 很 多 守护 进 
jd 就 是 Daemon 的 意思 ) 。 




















































































































该 进程 组 ID 不 会 因 组 长 进程 的 退出 而 受到 影响 。 








2) 会 话 周期 : 会 话 期 是 一 个 或 多 个 进程 组 的 集合 。 通 常 ， 一 个 会 话 开始 与 用 户 登 录 ， 终 止 于 
setsid 函 数 用 于 创建 一 个 新 的 会 话 ， 并 担任 该 会 话 组 的 组 长 。 调 用 setsid 有 3 个 作 | 


那么 ， 在 创建 守护 进程 时 为 什么 要 调用 setsid 函 数 呢 ? 由 于 创建 守护 进程 的 第 一 步调 


进程 组 1D 来 唯一 标识 ， 除 了 进程 号 (PID) 之 外 ， 进 程 组 ID 也 是 一 个 进程 的 必 备 














这 个 终端 ， 这 个 终端 就 称 为 这 些 进程 的 控制 终端 ， 当 控制 终端 被 关闭 时 ， 相 应 的 进程 都 会 自动 
他 地 变化 而 受到 影响 ， 那 么 就 必须 把 这 个 进程 变 成 一 个 守护 进 

















因此 完成 第 一 步 后 就 会 在 Shell 终 端 里 造成 一 程序 已 经 运行 完毕 的 假象 。 之 后 的 所 有 工作 都 在 子 进程 中 完成 ， 而 用 户 在 Shell 终 端 里 则 可 以 














由 1 号 进程 (init) 收养 它 ， 这 样 ， 原 先 的 子 进程 就 会 变 成 init 进 程 的 子 进程 。 


的 是 系统 函数 setsid， 在 具体 介绍 setsid 之 前 ， 首 先 要 了 解 两 个 概念 : 进程 组 和 会 话 期 。 


属性 。 每 个 进程 组 都 有 一 个 组 长 进程 ， 其 组 长 进程 的 进程 号 等 于 进程 组 













































































户 运行 的 所 有 进程 都 








户 退 出 ， 在 此 期 间 该 
































属于 这 个 会 话 期 。 


: @ 让 进程 摆脱 原 会 话 的 控制 ，@ 让 进程 摆脱 原 进程 组 的 控制 ，@ 让 进程 摆脱 原 控制 终端 的 控制 。 












































函数 来 创建 子 进程 ， 再 将 父 进程 退出 。 由 





























组 、 控 制 终端 等 ， 虽 然 父 进 程 退出 了 ， 但 会 话 期 、 进 程 组 、 控 制 终端 等 并 没有 改变 ， 





(3) 改变 当前 目录 为 根 目录 。 














这 一 步 也 是 必要 的 步骤 。 使 用 fork 创 建 的 子 进程 继承 了 父 进 程 的 当前 工作 目录 。 由 了 
系统 由 于 某 种 原因 要 进入 用 户 模式 ， 但 无 法 实现 ) 。 因 此 ， 通 常 的 做 法 是 让 "/" 作 为 守护 进程 


文件 权限 掩 码 是 指 屏蔽 掉 文件 权限 中 的 对 应 位 。 比 如 ， 有 个 文件 权限 掩 码 是 050， 它 就 


€ 
limi 















































在 进程 运行 中 ， 当 前 









































量 设 文件 权限 掩 码 。 


























该 子 进程 使 用 文件 带 来 了 诸多 的 麻烦 。 因 此 ， 把 文件 权限 掩 码 设置 为 0%， 可 以 大 大 增强 该 守护 进程 的 灵活 性 。 设 置 文件 权限 掩 码 的 函数 是 umas 


同文 件 权限 码 一 样 ， 

















(5) 关闭 文件 描述 符 。 




















无 法 结束 。 


在 上 面 的 第 二 步 之 后 ， 守 护 进 程 已 经 与 所 属 的 控制 终端 失去 了 联系 。 因 此 从 终端 输入 的 字符 


件 描述 符 为 0、1 和 2 的 3 个 文件 ( 常 说 的 输入 、 输 出 和 报错 ) 已 经 失去 了 存在 的 价值 ， 也 应 被 关闭 。 通 常 


























for (i=0; i<MAXFILE; i++) 
close (i); 


这 样 ， 一 个 简单 的 守护 进程 就 建立 起 来 了 。 


[5110.9] 





fincludecstdio.h» 
fincludecstdlib.h» 
dincludecstring.h» 
finclude«fcntl.h» 
fincludecunistd.h» 























蔽 了 文件 组 拥有 者 的 可 读 与 可 执行 权限 。 由 于 使 























能 达到 守护 进程 ， 守 护 进程 中 
按 如 下 方式 关闭 文件 描述 符 : 





实现 一 个 守护 进程 的 完整 实例 (每 隔 10s 在 /tmp/dameon.log 中 写 入 一 句 话 ) 。 


了 fork 函 数 时 ， 子 进程 全 盘 拷 贝 了 父 进 程 的 会 话 期 、 进 程 





此 ， 还 不 是 真正 意义 上 的 独立 。 而 setsid 函 数 能 够 使 进程 完全 独立 出 来 ， 从 而 摆脱 其 他 进程 的 控制 。 


录 所 在 的 文件 系统 (如 /mnt/usb) 是 不 能 卸载 的 ， 这 对 以 后 的 使 用 会 造成 诸多 的 麻烦 (比如 
的 当前 工作 目录 ， 这 样 就 可 以 避免 上 述 的 问题 。 当 然 ， 如 有 特殊 需要 ， 也 可 以 把 当前 工作 目录 换 成 




















他 的 路 径 。 


函数 新 建 的 子 进程 继承 了 父 进程 的 文件 权限 掩 码 ， 这 就 给 
通常 的 使 用 方法 为 umask (0) 。 
































fork 函 数 新 建 的 子 进程 会 从 父 进程 那里 继承 一 些 已 经 打开 了 的 文件 。 这 些 被 打开 的 文件 可 能 永远 不 会 被 守护 进程 读 写 ， 但 它们 一 样 消耗 系统 资源 ， 而 且 可 能 导致 所 在 的 文件 系统 











常规 方法 输出 的 字符 (如 printf) 也 不 可 能 在 终端 上 显示 出 来 。 所 以 ， 文 


#include<sys/wait.h> 
#include<sys/types.h> 
#include<sys/stat.h> 
#define MAXFILE 65535 


int main(){ 


这 时 ， 执 行 ps-eflgrep test 命 令 ， 发 现 它 还 在 运行 ， 只 是 向 到 后 台 去 运行 了 ， 如 


return 


pid t pc; 
int i,fd,len; 
char *buf-"this is a Dameonin"; 
len = strlen (buf); 
pc = fork(); /* 第 一 步 */ 
if (pc<0) { 
printf ("error fork\n"); 
exit (1); 
}else if(pc»0)( 
exit (0); 
} 
setsid(); /* 第 二 步 
chdir("/"); /* 第 三 3 
umask (0); /* 第 四 步 * 
for(i-0;i«MAXFILE;i-4) /* 第 五 步 */ 
close (i); 
while (1) { 
if ( (fd=open ("/tmp/dameon.log",O_CREAT|O_WRONLY |O_APPEND, 0600) ) <0) { 
perror ("open"); 7 7 7 
exit(1); 
l 
write (fd,buf,len*1); 
close (fq); 
sleep(10); 
0; 








行 编译 后 的 目标 文件 ， 发 现 它 好 像 执 行 一 下 就 退出 了 ， 如 图 10-14 所 示 。 























[sharexuglinux 1009 
[sharexu@linux 1009]$ ./test 
[sharexuēlinux 


[sharexu@linux 1089]5 test 
sharexy 27970 l ð21:20 7 00:00:00 ./test 
sharexu 27972 2 J 21:21 pts/8 00:00:00 grep test 
[sharexu@linux 16 

图 10-15 “用 ps 命令 发 现 后 台 运行 的 程序 
再 去 查看 /tmp/dameon ,log 文件， 还 在 每 隔 10s 就 打印 一 行 “this is a Dameon”， 如 图 10-16 所 示 。 


如 果 不 想 这 个 dameon 程 序 继续 进行 了 ， 可 以 直接 把 进程 杀 掉 ， 这 样 进 程 就 可 以 结束 了 ， 如 图 10-17 所 示 。 


[sharexuglinux 1009]$ tail /tmp/dameon.log 
this 15 Wurm 

this is a Dameon 

this is a Dameon 

this is a Dameon 

this is a Dameon 

this is a Dameon 

this 1s Dameon 

this is a Dameon 

this 1s a Dameon 
[sharexu@Llinux 1609]5 国 


图 10-16” 例 10.8 程 序 修改 的 文件 还 在 不 停 地 被 修改 
(sharexualinux 1009/$ kill -9 27970 
[sharexuglinux 1009]$ ps -ef | grep test 
sharexu 27977 2783? O 71:24 pts/0 00:00:00 grep test 
[sharexuGLinux 160915 J 
图 10-17 杀 掉 进程 后 ， 用 ps 命令 就 看 不 到 该 程序 在 执行 了 


所 以 ， 如 果 你 想 创建 一 个 可 以 脱离 终端 运行 的 进程 ， 守 护 进 程 是 优秀 的 选择 。 


10.5 ”本 章 小结 


本 章 主 要 介绍 了 进程 的 创建 和 使 用 ， 还 介绍 了 孤儿 进程 、 僵 尸 进 程 和 守护 进程 的 内 含 及 使 用 。 接 下 来 的 第 11 章 ， 将 介绍 进程 间 如 何 通信 的 问题 。 





第 11 章 ”进程 间 通 信 


进程 间 通 信 就 是 在 不 同 进程 之 间 传 播 或 交换 信息 ， 那 么 不 同 进程 之 间 存 在 着 什么 双方 都 可 以 访问 的 介质 呢 ? 首先 ， 进 程 间 通信 至 少 可 以 通过 传送 、 打 开 文 件 来 实现 ， 不 同 的 进程 通过 一 个 或 多 个 文件 来 
传递 信息 ， 事 实 上 ， 在 很 多 应 用 系统 里 都 使 用 了 这 种 方法 。 但 一 般 说 来 ， 进 程 间 通信 (Inter Process Communication, IPC) 不 包括 这 种 似乎 比较 低级 的 通信 方法 。UNIX 系 统 中 实现 进程 间 通 信 的 方法 很 多 ， 
而 且 不 幸 的 是 ， 极 少 方法 能 在 所 有 的 UNIX 系 统 中 进行 移植 (唯一 一 种 是 半 双 工 的 管道 ， 这 也 是 最 原始 的 一 种 通信 方式 ) 。 而 Linux 作 为 一 种 新 兴 的 操作 系统 ， 几 乎 支持 所 有 的 UNIX 下 常用 的 进程 间 通 信 方 
法 : 管道 、 消 息 队 列 、 共 享 内 存 、 信 号 量 、 套 接 字 等 。 其 中 ， 前 面 4 种 主要 用 于 同一 台 机 器 上 的 进程 间 通 信 ， 而 套 接 字 则 主要 用 于 不 同 机 器 之 间 的 网 络 通信 。 由 于 第 6 章 已 介绍 了 套 接 字 编 程 ， 本 章 不 再 现 
述 ， 将 主要 介绍 前 4 种 方式 。 











第 10 章 中 已 经 介绍 了 父子 进程 之 间 并 不 共享 数据 段 和 堆栈 段 ， 它 们 之 间 是 通过 管道 进行 通信 的 。 管 道 是 一 种 两 个 进程 间 进 行 单 向 通信 的 机 制 。 因为 管道 传递 数据 的 单 向 性 ， 管 道 又 称 为 半 双 工 管道 ， 管 
道 的 这 一 特点 决定 了 其 使 用 的 局 限 性 。 管 道 是 Linux 支 持 的 最 初 UNIX IPC 形 式 之 一 ， 具 有 以 下 特点 。 



























































(1) 数据 只 能 由 一 个 进程 流向 另 一 个 进程 (其 中 一 个 读 管道 ， 一 个 写 管道 ) ; 如 果 要 进行 双 工 通信 ， 则 需要 建立 两 个 管道 。 




















(2) 管道 只 能 用 于 父子 进程 或 者 兄弟 进程 间 通 信 ， 也 就 是 说 管道 只 能 用 于 具有 亲缘 关系 的 进程 间 通 信 。 


























除了 以 上 局 限 性 ， 管 道 还 有 其 他 一 些 不 足 ， 如 管道 没有 名 字 (无 名 管道 ) ; 管道 的 缓冲 区 大 小 是 受 限 制 的 ;管道 所 传输 的 是 无 格式 的 字 节 流 等 。 这 就 需要 管道 输入 方 和 输出 方 事先 约定 好 数据 格式 。 虽 
然 有 那么 多 不 足 ， 但 对 于 一 些 简单 的 进程 间 通 信 ， 管 道 还 是 完全 可 以 胜任 的 。 
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使 用 管道 进行 通信 时 ， 两 端的 进程 向 管道 读 写 数据 是 通过 创建 管道 时 ， 系 统 设置 的 文件 描述 符 进 行 的。 从 本 质 上 说 ， 管 道 也 是 一 种 文件 ， 但 它 又 和 一 般 的 文件 有 所 不 同 ， 可 以 克服 使 用 文件 进行 通信 的 
两 个 问题 ， 这 个 文件 只 存在 内 存 中 。 











通过 管道 通信 的 两 个 进程 ， 一 个 进程 向 管道 写 数据 ， 另 外 一 个 从 中 读数 据 。 写 入 的 数据 每 次 都 添加 到 管道 缓冲 区 的 未 尾 ， 读 数据 的 时 候 都 是 从 缓冲 区 的 头 部 读 出 数据 的 。 








管道 由 pipe () 函数 创建 ， 需 要 依赖 的 头 文件 是 : 





finclude «unistd.h» 





pipe () 的 函数 原型 是 : 





int pipe(int fd[2]); 




















pipe () 函数 创建 的 管道 处 于 一 个 进程 中 间 ， 在 实际 应 用 中 没有 太 大 的 意义 。 因 此 ， 一 个 进程 在 由 pipe () 创建 管道 后 ， 一 般 再 使 用 fork 建 立 一 个 子 进程 ， 然 后 通过 管道 实现 父子 进程 间 的 通信 。 管 道 
两 端 可 分 别 用 描述 字 fd[0] 以 及 fd[1] 来 描述 。 需 要 注意 的 是 ， 管 道 的 两 端 是 固定 了 任务 的 ， 即 一 端 只 能 用 于 读 ， 由 描述 字 fd[0] 表 示 ， 称 其 为 管道 读 端 ; 另 一 端 则 只 能 用 于 写 ， 由 描述 字 fd[1] 来 表示 ， 称 其 为 
管道 写 端 。 如 果 试图 从 管道 写 端 读 取 数据 ， 或 者 向 管道 读 端 写 入 数据 都 将 导致 错误 发 生 。 一 般 文件 的 I/O 函 数 都 可 以 用 于 管道 ， 如 close、read、write 等 。 
































































































































例 11.1 示 范 了 如 何在 父 进程 和 子 进程 间 实 现 通信 。 














【 例 11.1】 ”利用 管道 实现 在 父子 进程 间 通 信 。 














#include<unistd.h> 
#include<stdio.h> 
#include<stdlib.h> 
#include<string.h> 
#define INPUT 0 
#define OUTPUT 1 
int main() { 
int fd[2]; 
/* 定 义 子 进程 号 */ 
pid t pid; 
char buf[256]; 
int returned count; 
/* 创 建 无 名 管道 */ 
pipe (fd); 
/* 创 建 子 进程 */ 
pid-fork(); 
if (pid<0) ( 
printf ("Error in fork\n"); 
exit (1); 
Jelse if(pid == 0) { /* 执 行 子 进 程 */ 
printf("in the child processhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...Nn"); 
/* 子 进程 向 父 进程 写 数 据 ， 关 闭 管道 的 读 端 */ 
close (fd[INPUT]); 
write(fd[OUTPUT], "hello world", strlen("hello world")); 
exit(0); 
Jelse ( /* 执 行 父 进程 */ 
printf("in the parent processhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15788/OEBPS/Text/.. .Nn") ; 
/* 父 进程 从 管道 读 取 子 进程 写 的 数据 ， 关 闭 管道 的 写 端 */ 
close (fd[OUTPUT]) ; 
returned count = read(fd[INPUT], buf, sizeof (buf)); 
printf ("3d bytes of data received from child process: %s\n", returned count, buf); 


return 0; 


程序 的 执行 结果 是 : 





in the parent processhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/... 
in the child processhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/... 
11 bytes of data received from child process: hello world 








例 11.1 中 ， 在 子 进程 中 写 数据 ， 在 父 进程 中 读数 据 ， 两 个 进程 之 间 实 现 了 通信 : 父子 进程 分 别 拥有 自己 的 读 写 通 道 ， 为 了 实现 父子 进程 之 间 的 读 写 ， 只 需 把 无 关 的 读 端 或 写 端的 文件 描述 符 关 闭 即 可 。 
例 11.1 中 ， 将 父 进程 的 写 端 fd[1] 和 子 进程 的 读 端 fd[0] 关 闭 ， 则 父子 进程 之 间 就 建立 起 一 条 “ 子 进程 写 入 父 进 程 读 取 ”的 通道 。 同 样 ， 也 可 以 将 父 进 程 的 读 端 fd[0] 和 子 进程 的 写 端 fd[1] 关 闭 ， 则 父子 进程 之 
间 就 建立 起 一 条 “ 父 进程 写 入 子 进程 读 取 ”的 通道 ， 上 述 管道 又 被 称 为 无 名 管道 。 

















还 有 一 种 管道 叫 有 名 管道 (named pipe 或 FIFO) ， 它 不 同 于 无 名 管道 之 处 在 于 它 提供 一 个 路 径 名 与 之 关联 ， 以 FIFO 的 文件 形式 存在 于 文件 系统 中 。 这 样 ， 即 使 与 FIFO 的 创建 进程 不 存在 亲缘 关系 的 进 








程 ， 只 要 可 以 访问 该 路 径 ， 就 能 够 彼此 通过 FIFO 相 互通 信 (能 够 访问 该 路 径 的 进程 以 及 FIFO 的 创建 进程 之 间 ) ， 因 此 ， 通 过 FIFO 不 相关 的 进程 也 能 交换 数据 。 








有 名 管道 是 对 无 名 管道 的 一 种 改进 ， 二 者 区 别 如 图 11-1 所 示 。 

















11-1 有 名 管道 与 无 名 管道 的 区 别 














进行 读 写 操作 ， 使 用 非常 方便 ; @FIFO 严 格 地 遵循 先进 先 出 规则 ， 对 管道 及 FIFO 的 读 操作 总 是 从 开始 处 返回 数据 ， 对 它们 的 写 操作 则 是 把 数据 添加 到 未 尾 。 


有 名 管道 由 mkfifo () 函数 创建 ， 需 要 依赖 的 头 文件 是 : 





#include <sys/types.h> 
#include <sys/stat.h> 





mkfifo () 的 函数 原型 是 : 





int mkfifo (const char * pathname, mode t mode) 





该 函数 的 第 一 个 参数 是 一 个 普通 的 路 径 名 ， 也 就 是 创建 后 FIFO 的 名 字 。 第 二 个 参数 与 打开 普通 文件 的 open () 函数 中 的 mode 参 数 相同 。 如 果 mkfifo 的 第 一 个 参数 是 一 个 已 经 存在 的 路 径 名 时 ， 会 返回 
EEXIST 错 误 ， 所 以 一 般 典 型 的 调用 代码 首先 会 检查 是 否 返回 该 错误 ， 如 果 确 实 返 回 该 错误 ， 那 么 只 要 调用 打开 FIFO 的 函数 就 可 以 了 。 一 般 文件 的 MO 函数 都 可 以 用 于 FIFO， 如 close、read、write 等 。 














[5/12] 。 两 个 进程 用 有 名 管道 进行 通信 。 














功能 : 一 共有 两 个 程序 。 一 个 程序 用 于 读 管道 ， 另 一 个 程序 用 于 写 管道 。 其 中 在 读 管道 的 程序 中 创建 管道 ， 并 且 读 出 用 户 写 入 到 管道 的 内 容 ; 写 管道 的 程序 则 把 main () 函数 里 的 参数 写 入 管道 中 。 这 
两 个 程序 采用 的 是 非 阻 塞 式 读 写 管道 模式 。 


读 管 道 程序 mkfifo_r.cpp 的 源码 如 下 : 





#include <stdio.h> 
#include <sys/stat.h> 
#include <fcnt1.h> 
#include <unistd.h> 
#include <string.h> 
#include <stdlib.h> 
#define P FIFO "/tmp/p fifo" 
int main(int argc, char** argv)( 
char cache[100]; 
int fd; 
memset (cache,0, sizeof(cache)); /* 初 始 化 内 存 */ 
if(access(P FIFO,F OK)--0)( /* 管 道 文件 存在 */ 
execlp("rm","-f", P FIFO, NULL); /* 删 掉 */ 
Printf ("access.\n"); 


} 
if (mkfifo(P FIFO, 0777) < 0){ 

printf ("createnamed pipe failed.\n"); 
} 
fd- open(P FIFO,O RDONLY|O NONBLOCK); /* 非 阻塞 方式 打开 ， 只 读 */ 
while(1){ 

memset (cache,0, sizeof (cache)); 

if((read(fd,cache, 100)) == 0 )( /* 没 有 读 到 数据 */ 

printf ("nodata: \n"); 
} 
else( 
printf("getdata:$sWn", cache); /* 读 到 数据 ， 将 其 打印 */ 


} 
sleep (1) ;/* 休 了 眼 1s*/ 


l 
close (fd); 
return 0; 





写 管道 程序 mkfifo_w.cpp 的 源码 如 下 : 





#include <stdio.h> 
#include <fcnt1.h> 
#include <unistd.h> 
#define P FIFO "/tmp/p fifo" 
int main(int argc, char **argv)( 

int fd; 

if(argc« 2){ 

printf ("please input the write data. Wn"); 


fd- open(P FIFO,O WRONLY|O NONBLOCK); /* 非 阻塞 方式 */ 
write(fd,argv[1], 100); /* 将 argv[1] 写 道 fd 里 面 去 */ 
close (fd); 

return 0; 





编写 保存 上 述 两 个 文件 后 分 别 使 用 命令 : g++-o mkfifo r mkfifo_r.cpp 和 命令 : g++-o mkfifo w mkfifo_w.cpp 编 译 。 


为 了 能 更 好 地 观察 运行 效果 ， 需 要 把 这 两 个 程序 分 别 在 终端 里 运行 ， 在 这 里 首先 启动 读 管道 程序 。 读 管道 进程 在 建立 管道 后 就 开始 循环 地 从 管道 里 读 出 内 容 ， 如 果 没有 数据 可 读 ， 则 一 直 阻 塞 到 写 管道 





进程 向 管道 写 入 数据 。 在 启动 了 写 管道 程序 后 ， 读 进程 能 够 从 管道 里 读 出 用 户 的 输入 内 容 ， 程 序 运 行 结果 如 图 11-2、 图 11-3、 图 11-4 所 示 。 


[sharexuglinux 1:102]$ g++ -o nkfifo r mkfifo r.cpp 
[sharexuglinux 1102]$ g++ -o nkfifo w mkfifo w.cpp 
[sharexuelinux 1102] I| SER NA 
[sharexuglinux 1102]$ ./mkfifo r 
nodata: 

WEEE 

nodata: 

nodata 

nudata: 

nodata: 

nodata: 

nodata: 

nodata: 

nodata: 

getdata:111 

nedata: 

nodata: 

nodata: 

getdata: 

nodata: 

naodata ， 

nodata: 

getdata: 

nodata: 


Am 
L 


[sharexuglinux 110215 J 


[sharexu@linux 1162]$ ./mkfifo_w 
please input the write data. 
[sharexuglinux 1102]$ ./mkfifo w 111 
[sharexu@linux 1102]§ ./mkfifo w 222 
[sharexu@linux 1162]$ ./mkfifo_w 333 
[sharexu@linux 11621$ J 


图 11-3 ” 例 11.2 写 进程 执行 结果 截图 





@linux 110215 


- i 


sharexu 





EA 例 11.2 生 成 的 文件 
mkfifo_r 和 mkfifo_w 通 过 有 名 管道 进行 了 通信 ，mkfifo_w 发 送 了 什么 内 容 ，mkfifo_r 就 将 收 到 了 什么 内 容 。 


再 来 看 一 下 详细 的 代码 。 读 管道 程序 mkfifo_rcpp 中 ， 先 判断 管道 文件 是 否 存在 ， 如 果 存 在 ， 先 把 它 删 掉 。 





if (access (P_FIFO,F_OK)=0){ /* 管 道 文 件 存在 */ 
execlp("rm","-f", P FIFO, NULL); /* 删 掉 */ 
printf ("access.Nn"); 


} 





创建 一 个 有 名 管道 ， 注 意 判断 是 否 创 建成 功 ， 代 码 如 下 : 





if(mkfifo(P FIFO, 0777) < 0){ 
printf("createnamed pipe failed.Wn"); 


} 





以 只 读 方式 打开 有 名 管道 ， 代 码 如 下 : 


fd- open(P FIFO,O RDONLY|O NONBLOCK); /* 非 阻塞 方式 打开 ， 只 读 */ 











每 隔 1s 就 去 有 名 管道 中 读数 据 ， 如 果 读 到 了 数据 ， 将 其 打印 ， 如 果 没 有 读 到 数据 ， 则 输出 nodata。 注 意 ， 读 数据 之 前 ， 要 将 缓存 清空 ， 以 免 被 上 一 次 的 读 取 结果 影响 ， 代 码 如 下 : 








while(1){ 
memset (cache, 0, sizeof (cache)); 
if((read(fd,cache, 100)) — 0 ){ /* 没 有 读 到 数据 */ 
printf ("nodata: \n"); 


else( 
printf ("getdata:%s\n", cache); /* 读 到 数据 ， 将 其 打印 */ 


} 
sleep (1) ; /* 休 眠 1Ss*/ 








写 管道 程序 mkfifo_w.cpp 中 ， 只 要 先 以 可 写 的 方式 打开 有 名 管道 ， 并 往 里 头 写 数据 即 可 ， 代 码 如 下 : 





fd- open(P FIFO,O WRONLY|O NONBLOCK); /* 非 阻塞 方式 */ 
write(fd,argv[1], 100); /* 将 argv[1] 写 道 fd 里 面 去 */ 

















你 也 许 会 有 这 样 的 疑问 ， 能 否 使 用 有 名 管道 让 一 个 服务 器 和 多 个 客户 端 进行 双向 交流 ? 事实 上 ， 一 对 多 的 形式 经 常 出 现 ， 只 要 每 次 客户 端 向 服务 器 发 出 的 指令 小 于 PIPE_BUF (管道 写 入 最 大 值 ) ， 它 们 
就 可 以 通过 一 个 有 名 管道 向 服务 器 发 送 数据 ， 并 且 客 户 端 可 以 很 容易 地 知道 服务 器 传 发 数据 的 管道 名 。 但 问题 在 于 ， 服 务 器 不 能 用 一 个 管道 来 和 所 有 客户 打交道 。 如 果 不 止 一 个 客户 在 读 同 一 个 管道 ， 则 无 
法 确保 每 个 客户 都 得 到 自己 对 应 的 回复 。 































































































一 个 解决 办 法 就 是 每 个 客户 在 向 服务 器 发 送信 息 前 都 建立 自己 的 读 入 管道 ， 或 让 服务 器 在 得 到 数据 后 再 建立 管道 。 使 用 客户 的 进程 号 (pid) 作为 管道 名 是 一 种 常用 的 方法 。 客 户 可 以 先 把 自己 的 进程 号 
告诉 服务 器 ， 然 后 到 那个 以 自己 进程 号 命名 的 管道 中 读 取 回 复 。 














11.2 ”消息 队列 
































消息 队列 用 于 运行 于 同一 台 机 器 上 的 进程 间 通 信 ， 它 和 管道 很 相似 ， 是 一 个 在 系统 内 核 中 用 来 保存 消息 的 队列 ， 它 在 系统 内 核 中 是 以 消息 链表 的 形式 出 现 。 消 息 链表 中 节点 的 结构 用 msg 声 明 。 


























相关 的 函数 有 以 下 几 个 。 





(1) 创建 新 消息 队列 或 取得 已 存在 消息 队列 ， 函 数 原型 是 : 





int msgget (key t key, int msgflg); 











参数 中 : @Kkey 可 以 认为 是 一 个 端口 号 ， 也 可 以 由 函数 ftok 生 成 。@msgflg 如 果 等 于 IPC_CREAT， 若 没有 该 队列 ， 则 创建 一 个 并 返回 新 标识 符 ， 若 已 存在 则 返回 原 标识 符 ; msgflg 如 果 等 于 
IPC_EXCL， 若 没有 该 队列 ， 则 返回 -1; 若 已 存在 ， 则 返回 0; 











(2) 向 队列 读 / 写 消息 ， 函 数 原型 如 下 所 述 。 








msgrcv 从 队列 中 取 用 消息 : 














ssize t msgrcv(int msqid, void *msgp, size t msgsz, long msgtyp, int msgflg); 








msgsnd 将 数据 放 到 消息 队列 中 : 





int msgsnd(int msqid, const void *msgp, size t msgsz, int msgflg); 
































参数 中 : @msqid 是 消息 队列 的 标识 码 ; @msgp 是 指向 消息 缓冲 区 的 指针 。 此 位 置 用 来 暂时 存储 发 送 和 接收 的 消息 ， 是 一 个 用 户 可 定义 的 通用 结构 ， 但 一 般 定义 为 以 下 结构 : 
































struct msgstru( 
long mtype; // RFO 
char mtext [512]; 

H 








msgsz 是 指 消息 的 大 小 ; msgtyp 是 指 从 消息 队列 内 读 取 的 消息 形态 。 如 果 值 为 零 ， 则 表示 消息 队列 中 的 所 有 消息 都 会 被 读 取 。 








msgflg: 用 来 指明 核心 程序 在 队列 没有 数据 的 情况 下 所 应 采取 的 行动 。 如 果 msgflg 和 常数 IPC_NOWAIT 合 用 ， 则 在 msgsnd () 执行 时 若是 消息 队列 已 满 ， 则 msgsnd () 将 不 会 阻塞 ， 而 会 立即 返回 - 
1， 如 果 执 行 的 是 msgrcv() ， 则 在 消息 队列 呈 空 时 ， 不 做 等 待 马上 返回 -1， 并 设 定 错误 码 为 ENOMSG。 当 msgflg 为 0 时 ，msgsnd () 及 msgrcv () 在 队列 呈 满 或 呈 空 的 情形 时 ， 采 取 阻 塞 等 待 的 处 理 模 
式 。 




















(3) 设置 消息 队列 属性 ， 函 数 原型 是 : 





int msgctl(int msgqid, int cmd, struct msqid ds *buf ); 




















参数 中 的 msgctl 系 统 调用 对 msgqid 标 识 的 消息 队列 执行 cmd 操 作 ， 系 统 定义 了 3 种 cmd 操 作 : IPC_STAT、IPC_SET、IPC_RMID。1PC_STAT 用 来 获取 消息 队列 对 应 的 msqid_ds 数 据 结 构 ， 并 将 其 保存 
到 buf 指 定 的 地 址 空间 ; IPC_SET 用 来 设置 消息 队列 的 属性 ， 要 设置 的 属性 存储 在 buf 中 ; IPC_RMID 用 来 从 内 核 中 删除 msqid 标 识 的 消息 队列 。 

































































下 面 用 实例 来 看 下 如 何 用 消息 队列 来 进行 进程 间 的 通信 。 























【 例 11.3】 消息 队列 来 传输 数据 。 











接收 消息 msgreceive.cpp 的 源码 如 下 : 


#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <sys/msg.h> 
struct msg_st{ 

long int msg_type; 

char text[BUFSIZ]; 
H 
int main()( 

int running = 

int msgid = -1; 

struct msg st data; 

long int msgtype - 0; 

/* 建 立 消息 队列 */ 

msgid = msgget((key t)1234, 0666 | IPC CREAT); 

if (msgid == -1)( ` T 

fprintf (stderr, "msgget failed with error: %d\n", errno); 
exit (EXIT_FAILURE) ; 








} 
/* 从 队列 中 获取 消 ; 
while (running) { 
if (msgrcv (msgid, (void*)&data, BUFSIZ, msgtype, 0) == -1){ 
fprintf (stderr, "msgrcv failed with errno: d\n", errno); 
exit (EXIT_FAILURE) ; 





， 直 到 遇 到 end 消 息 为 止 */ 


printf ("You wrote: %s\n",data.text); 

/* 遇 到 end 结 束 */ 

if(strncmp(data.text, "end", 3) == 0){ 
running = 0; 


} 


l 

/* 删 除 消息 队列 */ 

if (msgctl (msgid, IPC RMID, 0) == -1){ 
fprintf (stderr, "msgctl(IPC RMID) failed"); 
exit(EXIT FAILURE); n 


l 
exit(EXIT SUCCESS); 





发 送 消息 msgsend.cpp 的 源码 如 下 : 





#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <sys/msg.h> 
#include <errno.h> 
#define MAX TEXT 512 
struct msg st( 

long int msg type; 

char text[MAX TEXT]; 


int main(){ 
int running = 1; 
struct msg st data; 
char buffer[BUFSIZ]; 
int msgid - -1; 





((key t)1234, 0666 | IPC CREAT); 

if (msgid == -1)( E 
fprintf (stderr, "msgget failed with error: %d\n", errno); 
exit (EXIT_FAILURE) ; 


} 
/* 向 消息 队列 中 写 消息 ， 直 到 写 入 end*/ 
while (running) { 
/* 输 入 数据 */ 
printf("Enter some text: "); 
fgets (buffer, BUFSIZ, stdin); 
data.msg type = 1; 
strcpy(data.text, buffer); 
/* 向 队列 发 送 数据 */ 
if (msgsnd (msgid, (void*)&data, MAX TEXT, 0) == -1){ 
fprintf (stderr, "msgsnd failed\n"); 
exit (EXIT FAILURE); 


l 

/* 输 入 end 结 束 输入 */ 

if (strncmp (buffer, "end", 3) == 0) 
running = 0; 

sleep (1); 


l 
exit(EXIT SUCCESS); 








程序 的 执行 结果 如 图 11-5 所 示 。 











IN 


[sharexu@linux 1103]$ g++ -0 msgreceive msgreceive.cpp 
]$ g++ -0 msgsend msgsend.cpp 
./msgsend 


[sharexuglinux 11¢ 
[sharexuglinux 1103]$ 
Enter some text: aaaa 
Enter some bbbbb 
Enter some CCCCCC 
Enter some ddd 
Enter some end 
[sharexu@linux 1163]s [] 


text: 


图 11-5 例 11.3 程 序 执行 结果 图 


[sharexu@linux 11 
You 





日 


wrote: aaaa 


bbbbb 


wrote: 

















注意 msgreceive.cpp 文 件 main 函 数 中 定义 的 变量 msgtype， 它 作为 msgrcv 函 数 的 接收 消息 类 型 参数 的 值 ， 其 值 为 0， 表 示 获 取 队列 中 第 一 个 可 
来 设置 发 送 的 消息 类 型 ， 即 其 发 送 的 消息 的 类 型 为 1。 所 以 程序 msgreceive 能 够 接收 到 程序 msgsend 发 送 的 消息 。 下 面 再 来 看 下 程序 详情 。 


























语句 data.msg type=1， 它 上 




















msgreceive.cpp 和 msgsend.cpp 中 ， 都 需要 建立 消息 队列 ， 不 像 有 名 管道 ， 只 需要 一 方 建立 有 名 管道 即 可 ， 代 码 如 下 : 


/* 建 立 消息 队列 */ 

msgid = msgget((key t)1234, 0666 | IPC CREAT); 

if (msgid == -1)( ` il 
fprintf (stderr, "msgget failed with error: d\n", errno); 
exit(EXIT FAILURE); 

} 


msgreceive.cpp 中 使 用 msgrcv 从 队列 中 获取 消息 ， 直 到 遇 到 end 消 息 为 止 ， 代 码 如 下 : 








while (running) { 

if(msgrcv (msgid, (void*)&data, BUFSIZ, msgtype, 0) == -1)( 
fprintf (stderr, "msgrcv failed with errno: $dWn", errno); 
exit(EXIT FAILURE); 

} 

printf ("You wrote: %s\n",data.text); 

/* 遇 到 end 结 束 */ 

if(strnomp(data.text, "end", 3) == 0){ 
running = 0; 


} 


程序 结束 时 ， 要 删除 消息 队列 ， 代 码 如 下 : 





if(msgctl(msgid, IPC RMID, 0) == -1){ 
fprintf (stderr, "msgctl(IPC RMID) failedWin"); 
exit(EXIT FAILURE); 

} 























msgsnd 发 送 消息 ， 直 到 需要 发 送 的 内 容 是 end 为 止 ， 代 码 如 下 : 











msgsend.cpp 中 ， 











/* 向 消息 队列 中 写 消息 ， 直 到 写 入 end*/ 
while (running) { 
/* 输 入 数据 */ 
printf("Enter some text: "); 
fgets (buffer, BUFSIZ, stdin); 
data.msg type = 1; 
strcpy(data.text, buffer); 
/* 向 队列 发 送 数据 */ 
if(msgsnd(msgid, (void*)&data, MAX TEXT, 0) 
fprintf (stderr, "msgsnd failed\n"); 
exit (EXIT_FAILURE) ; 


= -1){ 


l 

/* 输 入 end 结 束 输入 */ 

if (strncmp (buffer, 
running = 0; 

sleep (1); 


"end", 3) == 0) 


消息 队列 跟 有 名 管道 有 不 少 的 相同 之 处 ， 消 息 队列 进行 通信 的 进程 可 以 是 不 相关 的 进程 ， 同 时 它们 都 是 通过 发 送 和 接收 的 方式 来 传递 数据 的 。 在 命名 管道 中 ， 发 送 数据 




















它们 对 每 个 数据 都 有 一 个 最 大 长 度 的 限制 。 











数 ， 则 在 消息 队列 中 ， 发 送 数 据 





msgrcv 函 数 。 而 





msgsnd 函 数 ， 接 收 数据 


























与 命名 管道 相 比 ， 消 息 队列 的 优势 在 于 : @ 消 息 队列 也 可 以 独立 于 发 送 和 接收 进程 而 存在 ， 从 而 消除 了 在 同步 命名 管道 的 打开 和 关闭 时 可 能 产生 的 困难 ; @ 可 以 同时 通过 发 送 消息 以 避免 命名 管道 的 同 
由 进程 自己 来 提供 同步 方法 ，@ 接 收 程序 可 以 通过 消息 类 型 有 选择 地 接收 数据 ， 而 不 是 像 命名 管道 中 那样 ， 只 能 默认 地 接收 。 














步 和 阻塞 问题 ， 而 不 需 


























事实 上 ， 它 是 一 种 正 逐 渐 被 淘汰 的 通信 方式 ， 完 全 可 以 


11.3 ”共享 内 存 





的 消息 。 再 来 看 看 msgsend.cpp 文 件 中 while 循 环 中 的 
































write 函数 ， 接 收 数据 








read 








a 





流 管道 或 者 套 接口 的 方式 来 取代 它 ， 所 以 ， 建 议 读者 忽略 这 种 方式 。 





顾名思义 ， 共 享 内 存 就 是 允许 两 个 不 相关 的 进程 访问 同一 个 逻辑 内 存 。 共 享 内 存 是 在 两 个 正在 运行 的 进程 之 间 共 享 和 传递 数据 的 一 种 非常 有 效 的 方式 。 不 同 进程 之 间 共 享 的 内 存 通常 安排 在 同一 段 物理 





内 存 中 。 进 程 可 以 将 同一 段 共享 内 存 连 接 到 它们 自己 的 地 址 空间 中 ， 所 有 进程 都 可 以 访问 共享 内 存 中 的 地 址 ， 就 好 像 它们 是 由 
所 做 的 改动 将 立即 影响 到 可 以 访问 同一 段 共享 内 存 的 任何 其 他 进程 。 











不 过 ， 共 享 内 存 并 未 提供 同步 机 秆 




















CC 语言 函 数 malloc 分 配 的 内 存 一 样 。 而 如 果 某 个 进程 向 共享 内 存 写 入 数据 ， 























， 也 就 是 说 ， 在 第 一 个 进程 对 共享 内 存 的 写 操作 结束 之 前 ， 并 无 自动 机 制 可 以 阻止 第 二 个 进程 对 它 进 行 读 取 。 所 以 通常 需要 用 其 他 的 机 制 来 同步 对 共享 内 存 的 访问 。 
































来 创建 共享 内 存 ， 它 | 














到 的 头 文件 是 : 





在 Linux 中 也 提供 了 一 组 函数 接口 用 于 使 有 











共享 内 存 ， 首 先 常 








的 函数 是 shmget， 该 函数 上 














#include <sys/shm.h> 





int shmget(key t key, int size, int flag); 


























第 一 个 参数 ， 程 序 需要 提供 一 个 参数 Key ( 非 0 整 数 ) ， 它 有 效 地 为 共享 内 存 自命 名，shmget 消 数 运行 成 功 时 会 返回 一 个 与 key 相 关 的 共享 内 存 标识 符 ( 非 负 整数 ) ， 用 于 后 续 的 共享 内 存 函 数 ; 调用 失 
败 返回 -1。 









































不 相关 的 进程 可 以 通过 该 函数 的 返回 值 访问 同一 共享 内 存 ， 它 代表 程序 可 能 要 使 用 的 某 个 资源 ， 程 序 对 所 有 共享 内 存 的 访问 都 是 间接 的 。 程 序 先 通过 调用 shmget 函 数 并 提供 一 个 键 ， 再 由 系统 生成 一 个 
相应 的 共享 内 存 标识 符 (shmget 函 数 的 返回 值 ) 。 











第 二 个 参数 ，size 以 字 节 为 单位 指定 需要 共享 的 内 存 容量 。 























第 三 个 参数 ，shmflg 是 权限 标志 ， 它 的 作用 与 open 函 数 的 mode 参 数 一 样 ， 如 果 要 想 在 key 标 识 的 共享 内 存 不 存在 的 条 件 下 创建 它 的 话 ， 可 以 与 |PC_CREAT 做 或 操作 。 共 享 内 存 的 权限 标志 与 文件 的 读 
写 权限 一 样 ， 举 例 来 说，0644 表 示人 允许 一 个 进程 创建 的 共享 内 存 被 内 存 创建 者 所 拥有 的 进程 向 共享 内 存 读 取 和 写 入 数据 ， 同 时 其 他 用 户 创建 的 进程 只 能 读 取 共享 内 存 。 






































当 共享 内 存 创建 后 ， 其 余 进 程 可 以 调用 shmat 将 其 连接 到 自身 的 地 址 空间 中 ， 它 的 函数 原型 是 : 























void *shmat(int shmid, void *addr, int flag); 

















shmid 为 shmget 函 数 返 回 的 共享 存储 标识 符 ，addr 和 flag 参 数 决定 了 以 什么 方式 来 确定 连接 的 地 址 ， 函 数 的 返回 值 即 是 该 进程 数据 段 所 连接 的 实际 地 址 ， 





他 进程 可 以 对 此 进程 进行 读 写 操作 。 




















shmdt 函 数 用 于 将 共享 内 存 从 当前 进程 中 分 离 。 注 意 ， 将 共享 内 存 分 离 并 不 是 删除 它 ， 只 是 使 该 共享 内 存 对 当前 进程 不 再 可 用 。 它 的 原型 如 下 : 














int shmdt(const void *shmaddr); 











参数 shmaddr 是 shmat 函 数 返回 的 地 址 指针 ， 调 用 成 功 时 返回 90， 失败 时 返 




















例 11.4 就 以 两 个 不 相关 的 进程 来 说 明 进 程 间 如 何 通过 共享 内 存 来 进行 通信 。 其 中 一 个 文件 consumer.cpp 创 建 共享 内 存 ， 并 读 取 其 中 的 信息 ， 另 一 个 文件 producer.cpp 向 共享 内 存 中 写 入 数据 。 为 了 方 
便 操作 和 数据 结构 的 统一 ， 在 文件 shm_com.h 中 为 这 两 个 文件 定义 了 相同 的 数据 结构 。 结 构 shared_use_st 中 的 written 作为 一 个 可 读 或 可 写 的 标志 ， 非 0 表示 可 读 ，0 表 示 可 写 ，text 则 是 内 存 中 的 文件 。 

















【 例 11.4】 ”使 用 共享 内 存 进行 进程 间 通 信 。 














shm_com.h 的 源码 如 下 : 





#ifndef _SHMCOM H HEADER 
#define SHMCOM H HEADER 
#define TEXT SZ 2048 
struct shared use st { 
int written; ` 
char text[TEXT SZ]; 
F 
#endif 





consumer.cpp 的 源码 如 下 : 





#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <sys/shm.h> 
#include "shm com.h" 
int main(){ ` 
int shmid; 
srand ( (unsigned int)getpid()); 
shmid = shmget((key t)1234, sizeof (struct shared use st), 0666 | IPC CREAT); 
if (shmid 一 -1) ( ux T 
fprintf (stderr, "shmget failed\n"); 
exit (EXIT_FAILURE) ; 


void *shared memory = (void *)0; 
shared memory = shmat (shmid, (void *)0, 0); 
if (shared memory == (void *)-1) { 


fprintf (stderr, "shmat failed\n"); 
exit (EXIT_FAILURE) ; 
} 
printf ("Memory attached at %X\n", (long)shared | memory) ; 
struct shared use st *shared stuff; 
shared stuff = (struct shared : use st *)shared memory; 
shared : stuff-»written - 0; 
int running - 1; 
while (running) { 
if (shared stuff-»written)( 
printf ("You wrote: $s", shared stuff-^text); 
sleep( rand() $ 4 ); m 
shared stuff-»written = 0; 
if (strncmp (shared stuff-»text, "end", 3) == 0) ( 
running = 0; T 
} 
} 
} 
if (shmdt (shared memory) == -1){ 
fprintf (stderr, "shmdt failed\n"); 
exit (EXIT FAILURE); 


} 

if (shmctl(shmid, IPC RMID, 0) == -1){ 
fprintf (stderr, "shmctl(IPC RMID) failedin"); 
exit(EXIT FAILURE); 

} 

exit (EXIT SUCCESS); 





producer.cpp 的 源 代码 如 下 : 


#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <sys/shm.h> 
#include "shm com.h" 
int main()( ` 


int shmid; 
shmid = shmget((key t)1234, sizeof(struct shared use st), 0666 | IPC CREAT); 
if (shmid = -1)( 


fprintf (stderr, "shmget failedWn"); 
exit(EXIT FAILURE); 


void *shared memory = (void *)0; 
shared memory - shmat(shmid, (void *)0, 0); 
if (shared memory == (void *)-1){ 


fprintf (stderr, "shmat failedWin"); 
exit(EXIT FAILURE); 
} 
printf ("Memory attached at %X\n", (long)shared memory); 
struct shared use st *shared stuff; E 
shared stuff = (struct shared use st 
int running - 1; 3*5 
char buffer[BUFSIZ]; 
while (running) { 
while (shared stuff->written == 1){ 
sleep(1); 


*)shared memory; 


printf("waiting for clienthttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/. 


printf("Enter some text: "); 

fgets(buffer, BUFSIZ, stdin); 

strncpy (shared stuff-»text, buffer, TEXT SZ); 

shared stuff-»written = 1; 

if (strnemp (buffer, "end", 3) 
running = 0; 


= 0 4 
} 

} 

if (shmdt (shared | memory) 


1) 
fprintf (stderr, "shmdt VES SN 
exit(EXIT FAILURE); 


l 
exit(EXIT SUCCESS); 
} 





程序 的 执行 结果 如 图 11-6 和 图 11-7 所 示 。 
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g++ -0 consumer consumer .cpp 
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图 11-6” 例 11.4 生 产 者 执行 结果 图 
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图 11-7 例 11.4 消 费 者 执行 结果 图 
程序 大 体 思路 为 : 程序 consumer 创 建 共 享 内 存 ， 然 后 将 它 连接 到 自己 的 地 址 空间 中 。 在 共享 内 存 的 开始 处 使 用 了 一 个 结构 struct_use_st， 该 结构 中 有 个 标志 written ， 当 共享 内 存 中 有 其 他 进程 向 它 写 
入 数据 时 ， 共 享 内 存 中 的 written 被 设置 为 0， 程 序 等 待 ; 当 它 不 为 0 时 ， 表 示 没 有 进程 向 共享 内 存 写 入 数据 ， 程 序 就 从 共享 内 存 中 读 取 数 据 并 输出 ， 然 后 重新 设置 共享 内 存 中 written 的 值 为 0， 即 让 其 可 被 
shmwrite 进 程 写 入 数据 。 程 序 producer 取 得 共享 内 存 并 连接 到 自己 的 地 址 空间 中 ， 检 查 共 享 内 存 中 的 written 是 否 为 0: 若 不 是 0， 表 示 共 享 内 存 中 的 数据 还 没有 被 完 ， 则 等 待 其 他 进程 读 取 完 成 ， 并 提示 
户 等 待 ; 若是 0， 表 示 没有 其 他 进程 对 共享 内 存 进 行 读 取 ， 则 提示 用 户 输入 文本 ， 并 再 次 设置 共享 内 存 中 的 written 为 1， 表 示 写 完成 ， 其 他 进程 可 对 共享 内 存 进 行 读 操作 。 
再 来 看 下 详细 的 代码 讲解 。 
consumer.cpp 中 ， 用 shmget 创 建 了 一 个 shared_use_st 结 构 体 大 小 的 共享 内 存 ， 代 码 如 下 : 











int shmid; 
srand((unsigned int)getpid()); 


shmid-shmget((key t)1234,sizeof (struct shared use st),0666| IPC CREAT); 


if (shmid = -1) ( 
fprintf (stderr, "shmget failedWn"); 


exit(EXIT FAILURE); 





将 该 共享 内 存 映 射 到 进程 的 地 址 空间 上 ， 代 码 如 下 : 


void *shared memory = (void *)0; 
shared memory = shmat(shmid, (void *)0, 0); 
if (shared memory == (void *)-1) ( 
fprintf (stderr, "shmat failed\n"); 
exit (EXIT_FAILURE) ; 
} 


printf ("Memory attached at %X\n", (long) shared memory); 


将 shared_ memory 分 配给 shared_stuff， 然 后 它 输出 written 中 的 文本 。 
如 下 : 


struct shared use st *shared stuff; 
Shared stuff - (struct shared use st *)shared memory; 
Shared stuff-»written = 0; 7 7 B 
int running - 1; 
while (running) { 
if (shared stuff-»written)( 
printf ("You wrote: $s", shared stuff-^text); 
sleep( rand() $ 4 ); pi 
shared stuff-»written = 0; 
if (strncmp (shared stuff-»text, 
running = 0; a 
} 
} 


"end", 3) 一 0) ( 


最 后 ， 共 享 内 存 被 分 离 ， 然 后 删除 ， 代 码 如 下 : 


if (shmdt (shared memory) == -1){ 
fprintf (stderr, "shmdt failed\n"); 
exit (EXIT FAILURE); 

} 

if (shmctl(shmid, IPC RMID, 0) 

fprintf (stderr, "shmctl (IPC | RMID) 

exit(EXIT FAILURE); 


failed"); 


producer.cpp 中 ， 前 面 映射 共享 内 存 的 和 consumer.cpp 中 的 一 样 , 使 


循环 将 一 直 执 行 到 在 written 中 找到 end 字 符 串 为 止 。 调 





























sleep 强 迫 消费 者 程序 在 临界 区 域 多 待 一 会 ， 让 生产 者 程序 等 待 ， 代 码 




















相同 的 键 值 1234 来 取得 并 连接 同一 个 共 








t 享 内 存 段 ， 然 后 提示 











户 输入 一 些 文本 。 如 果 标志 written 被 设置 ， 生 产 者 就 知道 消费 者 












































后 ， 生 产 者 将 可 以 写 入 新 的 数据 并 : 





重新 设置 这 个 标志 。 它 还 使 








字符 串 end 来 终止 并 分 离 共 享 内 存 段 ， 代 码 如 下 : 

















进程 还 未 读 完 上 一 次 的 数据 ， 因 此 就 继续 等 待 。 当 其 他 进程 清除 了 这 个 标志 
while (running) { 
while(shared stuff-»written == 1){ 
sleep (1); 


printf ("waiting for clienthttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/. 


} 

printf ("Enter some text: "); 

fgets (buffer, BUFSIZ, stdin); 

strncpy(shared stuff->text, buffer, TEXT S2); 

shared stuff-»written = 1; H 

if (strncmp (buffer, "end", 
running = 0; 


3) = 


} 


NDS 























事实 上 ， 这 个 程序 是 不 安全 的 ， 当 有 多 个 程序 同时 向 共享 内 存 中 读 写 数据 时 ， 问 题 就 会 出 现 。 可 能 你 会 认为 ， 可 以 改变 一 下 written 的 使 用 方式 来 解决 问题 。 例 如 ， 只 有 当 written 为 0 时 进程 才 可 以 向 共 


享 内 存 写 入 数据 ， 而 只 有 当 written 不 为 0 时 才能 对 其 进行 读 取 ， 同 时 把 written 进行 加 1 操作 ， 读 取 完 后 进行 减 1 操作 ， 这 就 有 点 像 文 件 锁 中 的 读 写 锁 的 功能 。 














但 实际 上 这 都 不 是 原子 操作 ， 所 以 这 种 做 法 是 不 可 行 的。 试想 当 written 为 0 时 ， 如 果 有 两 个 进程 同时 访问 共享 内 存 ， 它 们 就 会 发 现 written 为 0， 于 是 两 个 进程 都 对 其 进行 写 操作 ， 这 种 操作 显然 不 行 。 
当 written 的 值 为 1 时 ， 有 两 个 进程 同时 对 共享 内 存 进行 读 操作 时 也 是 如 此 ， 当 这 两 个 进程 都 读 取 完 时 ，written 的 值 就 变 成 了 -1。 
































想 让 程序 安全 地 执行 ， 就 要 有 一 种 进程 同步 的 进 制 ， 保 证 在 进入 临界 区 的 操作 是 原子 操作 。 例 如 ， 可 以 使 用 前 面 所 讲 的 信号 量 来 进行 进程 的 同步 。 因 为 对 信号 量 的 操作 都 是 原子 性 的 。 








使 用 共享 内 存 的 优 缺 点 如 下 所 述 。 























(1) 优点 : 使 用 共 

















t 享 内 存 进行 进程 间 的 通信 非常 方便 ， 而 且 函 数 的 接口 也 简单 ， 数 据 的 共享 还 使 进程 间 的 数据 不 用 传送 ， 而 是 直接 访问 内 存 ， 也 加 快 了 程序 的 效率 。 同 时 ， 它 也 不 像 无 名 管道 那样 要 求 








通信 的 进程 有 一 定 的 父子 关系 。 














(2) 缺点 : 共享 内 存 没有 提供 同步 的 机 制 ， 这 使 得 在 使 用 共享 内 存 进 行进 程 间 通信 时 ， 人 往往 要 借助 其 他 的 手段 来 进行 进程 间 的 同步 工作 。 


114 信号 量 










































































第 9 章 中 用 于 多 线程 同步 的 方式 中 已 经 提 及 信号 量 ， 但 用 于 多 线程 同步 的 信和 号 量 是 POSIX 信 号 量 ， 而 本 节 即 将 要 展开 的 是 SYSTEM V 信 号 量 ， 本 质 上 说 这 两 种 都 是 用 户 态 进程 可 以 使 用 的 信号 量 。 























SYSTEM V 信 号 量 ， 下 面 简称 为 信号 量 














在 Linux 中 提供 了 一 组 函数 接 



































于 使 用 信号 量 ， 首 先 常用 的 函数 是 semget， 该 函数 用 来 创建 和 打开 信号 量 ， 它 用 到 的 头 文件 是 : 



































#include <sys/types.h> 
#include «sys/ipc.h» 
#include <sys/sem.h> 





int semget (key_t 


key, int nsems, int semflg); 














该 函数 执行 成 功 返 回信 号 量 标示 符 ， 失 败 则 返回 -1。 参 数 key 是 函数 通过 调用 ftok 函 数 得 到 的 链 值 ，nsems 代 表 创 建 信号 量 的 个 数 ， 如 果 只 是 访问 而 不 创建 则 可 以 指定 该 参数 为 0， 但 一 旦 创建 了 该 信号 





























量 个 数 。 只 要 不 删除 该 信号 量 ， 就 可 以 重新 调用 该 函数 创建 该 键 值 的 信号 量 ， 该 函数 只 是 返回 以 前 创建 的 值 ， 而 不 会 重新 创建 。semflg 指 定 该 信号 量 的 读 写 权限 ， 当 创建 信号 量 时 不 

















量 ， 就 不 能 更 改 其 信号 


许 加 IPC_CREAT， 若 指定 











IPC_CREAT|IPC_EXCL 后 创建 时 发 现存 在 该 信号 量 ， 创 建 失败 。 





























semop 函 数 ， 上 


于 改变 信号 量 的 值 ， 原 型 是 : 








int semop (int semid, struct sembuf *sops, unsigned nsops) 


sem _id 是 由 semg 


et 返回 的 信号 量 标识 符 ，sembuf 结 构 的 定义 如 下 : 





struct sembuf( 


short sem num; // 除非 使 用 一 组 信 
short sem op; 


short sem fli 


semctl 函 数 ， 该 函 






量 ， 否 则 它 为 0 
// 信号 量 在 一 次 操作 中 需 要 改变 的 数据 ， 通 常 是 两 个 数 ， 
// 一 个 是 -1， 即 P (等 待 ) 操作 ， 一 个 是 +1， 即 V (发 送信 号 ) 操作 。 
g; // 通常 为 SEM UNDO, 使 操作 系统 跟踪 信号 
/ 并 在 进程 没有 释放 该 信号 量 而 终止 时 ， AUR 统 释放 信和 号 量 





























数 用 来 直接 控制 信号 量 信息 ， 它 的 原型 是 : 


























int semctl(int semid, int semnum, int cmd, http://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15788/OEBPS/Text/...); 


如 果 有 第 4 个 参数 ， 


它 通常 是 一 个 union semum 结 构 ， 定 义 如 下 : 





union semun( 
int val; 


struct semid ds *buf; 
unsigned short *arry; 


HN 



























































前 两 个 参数 与 前 面 一 个 函数 中 的 一 样 ，cmd 通 常 是 SETVAL 或 1PC_RMID。SETVAL 用 来 把 信号 量 初始 化 为 一 个 已 知 的 值 。p 值 通过 union semun 中 的 val 成 员 设 置 ， 其 作用 是 在 信号 量 第 一 次 使 用 前 对 它 


进行 设置 。IPC_RMID 用 于 删除 一 个 已 经 无 须 继续 使 用 的 信号 量 标识 符 。 




































































共享 内 存 是 进程 间 通 信 的 最 快 的 方式 ， 但 是 共享 内 存 的 同步 问题 自身 无 法 解决 ( 即 进程 该 何 时 去 共享 内 存 取得 数据 ， 而 何 时 不 能 取 ) ， 但 用 信号 量 即 可 轻易 解决 这 个 问题 。 下 面 使 用 例 11.5 来 说 明 如 何 



































使 用 信号 量 解决 共享 内 存 的 同步 问题 。 这 个 例子 的 主要 功能 是 writer 向 reader 传 递 数 据 ， 并 且 只 有 在 writer 发 送 完毕 后 ，reader 才 取 数 据 ， 否 则 阻塞 等 待 。 






































【 例 11.5】 使 


信号 量 实现 进程 间 通 信 。 








reader.cpp 的 代码 是 : 





#include <sys/types.h> 
#include «sys/ipc.h» 
#include <sys/sem.h> 


finclude <stdio. 


h> 


#include <unistd.h> 
#include <stdlib.h> 
#include <string.h> 
#include <sys/shm.h> 


#include <errno. 


#define SEM KEY 

(define SHM KEY 

union semun | { 
int val; 

H 


int main (void) { 


h> 
4001 
5678 


/*create a shm*/ 
int semid, shmid; 


shmid = shmget (SHM_KEY, sizeof (int), IPC_CREAT |0666) ; 


if (shmid<0) { 
printf ("create shm error\n"); 
return -1; 


} 

void * shmptr; 

shmptr =shmat (shmid, NULL, 0) 7 

if (shmptr (void *)-1)( 
printf("shmat error:$sWn",strerror (errno)); 
return -1; 





} 
int * data = (int *)shmptr; 
semid = semget(SEM KEY,2,IPC CREAT|0666) ; /* 这 里 是 创建 一 个 semid， 并 且 有 两 个 信号 量 */ 
union semun semun17/* 下 面 这 四 行 就 是 初始 化 那 两 个 信号 量 ， 一 个 val=0, 另 一 个 val=1*/ 
semunl.val-0; 
semct1 (semid, 0, SETVAL, semunl) ; 
semunl.val-1; 
semct1 (semid, 1, SETVAL, semunl) ; 
struct sembuf sembufl; 
while (1) { 
sembuf1 .sem_num=07/*sem_num=0 指 的 是 下 面 操作 指向 第 一 个 信号 量 ， 上 面 设 置 可 知 其 val-0*/ 
sembufl.sem op--1; /* 初 始 化 值 为 0， 再 -1 的 话 就 会 等 待 */ 
sembufl.sem flg-SEM UNDO; 
semop (semid, &sembuf1,1) ;/*reader 在 这 里 会 阻塞 ,直到 收 到 信号 */ 
printf ("the NUM:$dMn",*data) ;/* 输 出 结果 */ 
sembufl.sem num * 这 里 让 writer 再 次 就 绪 ， 就 这 样 循 环 */ 
sembufl.sem op: 
sembufl.sem flg-SEM UNDO; 
semop (semid, &sembuf1, 1) ; 
l 


return 0; 




















writer.cpp 的 代码 是 : 


#include <sys/types.h> 
#include <sys/ipc.h> 
#include <sys/sem.h> 
#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 
#include <string.h> 
#include <sys/shm.h> 
#include <errno.h> 
#define SEM KEY 4001 
#define SHM KEY 5678 
union semun ( 
int val; 
H 
int main (void) { 
/*create a shm*/ 
int semid, shmid; 
shmid = shmget (SHM_KEY, sizeof (int), IPC_CREAT |0666) ; 


if (shmid<0) { 
printf ("create shm error\n"); 
return -1; 


l 
void * shmptr; 
shmptr -shmat (shmid, NULL, 0); 
if(shmptr == (void *)-1)( 
printf("shmat error:$sWn",strerror (errno)); 
return -1; 
l 
int * data = (int *)shmptr; 
semid = semget (SEM KEY,2,0666) ; 
struct sembuf sembufl; 
union semun semunl; 
while (1) { 
sembuf1 .sem num=1;/* 这 里 指向 第 2 个 信号 量 (sem num-1) */ 
sembufl.sem op=-1;V/* 操 作 是 -1， 因 为 第 2 个 信号 量 初始 值 为 1， 所 以 下 面 不 会 阻塞 */ 
sembufl.sem flg-SEM UNDO; 
semop (semid, &sembuf1, 1) ;/* 继 续 */ 
scanf("$d",data); /* 用 户 在 终端 输入 数据 */ 
sembuf1.sem_num=0;/* 这 里 指向 第 一 个 信号 量 */ 
sembufl.sem op=1;/* 操 作 加 1*/ 
sembufl.sem flg-SEM UNDO; 
semop (semid, &sembuf1, 1) ; 
/* 执 行 加 1 后 ， 我 们 发 现 ，reader 阻 塞 正 是 由 于 第 一 个 
那 reader 就 绪 后 writer 继 续 循环 ， 发 现 第 二 个 信号 量 
} 


return 0; 











为 0， 无 法 减 1， 而 现在 Writer 先 为 其 加 1， 
经 减 为 0， 则 阻塞 了 ， 我 们 回 到 reader*/ 









程序 的 执行 结果 如 图 11-8 所 示 。 











[sharexu@linux 11 - $ 
the NUM:1111 

the NUM: 

the NUM 

the NUM: 


0 





图 11-8 例 11.5 程 序 执行 结果 图 


reader.cpp 中 ， 先 获得 共享 内 存 ， 并 把 进程 连接 到 该 地 址 空间 上 ， 代 码 如 下 : 


shmid = shmget (SHM_KEY, sizeof (int), IPC_CREAT |0666) ; 
if (shmid<0){ 

printf ("create shm error\n"); 

return -1; 


void * shmptr; 
shmptr =shmat (shmid, NULL, 0) ; 


if(shmptr == (void *)-1){ 
printf ("shmat error:$sWn",strerror (errno) ); 
return -1; 


} 
int * data = (int *)shmptr; 


创建 并 初始 化 2 个 信和 号 量 ， 代 码 如 下 所 示 。 第 一 个 初始 值 为 0， 第 二 个 初始 值 为 1。 





semid = semget (SEM_KEY, 2, IPC_CREAT |0666) ;/* 这 里 是 创建 一 个 semid， 并 且 有 两 个 信 
union semun semun1;/* 下 面 这 四 行 就 是 初始 化 那 两 个 信号 量 ， 一 个 val=0, 男 一 个 val=1*/ 


号 量 */ 


semunl.val-0; 

Semct1l (semid, 0, SETVAL, semunl) ; 
semunl.val-1; 

semct1 (semid, 1, SETVAL, semunl) ; 
struct sembuf sembufl; 


reader 要 等 到 writer 有 数据 之 后 ， 才 开始 读 ; 把 数据 读 到 之 后 ， 让 writer 可 以 继续 写 ， 代 码 如 下 : 





while(1){ 
sembuf1 .sem_num=0;/*sem_num=0 指 的 是 下 面 操作 指向 第 一 个 信号 量 ， 上 面 设置 可 知 其 val-0*/ 
sembufl.sem op--1; /* 初 始 化 值 为 0， 再 -1 的 话 就 会 等 待 */ 
sembufl.sem flg-SEM UNDO; 
semop (semid, &sembuf1,1) ;/*reader 在 这 里 会 阻塞 , 直到 收 到 信号 */ 
printf ("the NUM:%d\n",*data);/* 输 出 结果 */ 
sembuf1 .sem_num=1;/* 这 里 让 writer 再 次 就 绪 ， 就 这 样 循环 */ 
sembufl.sem op-1; 
sembufl.sem flg-SEM UNDO; 
semop (semid, &sembuf1, 1) ; 





writer.cpp 连 接 到 同一 个 共享 内 存 ， 并 接收 相同 的 信号 量 ， 代 码 如 下 : 


shmid = shmget (SHM KPY, sizeof (int),IPC CREAT|0666); 
if (shmid«0)( x E 

printf ("create shm error\n"); 

return -17 


void * shmptr; 
shmptr =shmat (shmid, NULL, 0) ; 


if (shmptr == (void *)-1){ 
printf ("shmat error:%s\n",strerror (errno) ); 
return -1; 


} 
int * data = (int *)shmptr; 
semid = semget (SEM KEY, 2,0666) ; 





先 写 数据 ， 写 完 后 改变 信号 ， 让 读者 可 以 读 ， 代 码 如 下 : 





while(1){ 
sembuf1 .sem_num=1;/* 这 里 指向 第 2 个 信号 量 (sem num-1) */ 
sembufl.sem op=-1;/* 操 作 是 -1， 因 为 第 2 个 信号 量 初始 值 为 1， 所 以 下 面 不 会 阻塞 */ 
sembufl.sem flg-SEM UNDO; 
semop (semid, &sembuf1, 1) 7;/* 继 续 */ 
scanf( ",data); /* 用 户 在 终端 输入 数据 */ 
Sembuf1.sem_num=0;/* 这 里 指向 第 一 个 信号 量 */ 
sembufl.sem op-1; /* 操 作 加 1*/ 
sembufl.sem flg-SEM UNDO; 
semop (semid, &sembuf1, 1) ; 
/* 执 行 +1 后 ， 我 们 发 现 ，reader 阻 塞 正 是 由 于 第 一 个 信号 量 为 0， 无 法 减 一 ， 而 现在 writer 先 为 其 加 1， 
那 reader 就 绪 ! writer 继 续 循 环 ， 发 现 第 二 个 信 经 减 为 0， 则 阻塞 了 ， 我 们 回 到 reader*/ 
} 














多 打开 几 个 终端 ， 同 时 执行 writer 程 序 ， 看 是 否 reader 能 够 正确 地 读 到 数据 ， 即 是 否 能 得 到 如 图 11-9 所 示 的 结果 。 








[c [sharexu@linux 1105]$ 
the NUM: arex $ ./ [sharexuglinux 1105]$ 


the NUM: i 11111 


"FE 


. /Writer 


the NUM:33333 44444 
the NUM:444: ü 
the NUM: 


[] 





图 11-9 例 11.5 程 序 多 个 终端 同时 执行 wtite 结 果 图 
































程序 结果 显示 ，reader 程 序 可 以 读 到 多 个 writer 发 送 的 数据 。 于 是 ， 就 实现 了 用 信号 量 共享 内 存 的 同步 。 











11.5 ipcs 命 令 
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ipcs 是 一 个 UINX/Linux 的 命令 ， 用 于 报告 系统 的 消息 队列 、 信 号 量 、 共 享 内 存 等 。 下 面 列举 一 些 常 









































(1) ipcs-a 用 于 列 出 本 用 户 所 有 相关 的 ipcs 参 数 ， 结 果 如 图 11-10 所 示 。 
































[sharexu@linux 1105]$ ipcs -a 


Shared Memory Segments 

shmid owner 
0x0000162e 131072 sharexu 
0x000004d2 163841 sharexu 


Semaphore Arrays 
semid owner 
0x00000000 65538 sharexu 
0x00000fa1 98307 sharexu 


Message Queues 
msqid owner 


图 11-10 ”ipcs-a 命 令 执行 结果 图 
(2) ipcs-q 用 于 列 出 进程 中 的 消息 队列 ， 结 果 如 图 11-11 所 示 。 


(3) ipcs-s 用 于 列 出 所 有 的 信号 量 ， 结 果 如 图 11-12 所 示 。 


[sharexu@linux 1103]$ ipcs -q 


Message Queues 
msgid owner = yte messages 
0x000004d2 98304 sharexu 6 0 


图 11-11 ipcs-q 命 令 执行 结果 图 


[sharexu@linux 1105]$ ipcs 


Semaphore Arrays 
semid owner 
OxODOO00000 65538 sharexu 
OxOOOO00fal 98307 sharexu 


图 11-12 ipcs-s 命 令 执行 结果 图 

(4) ipcs-m 用 于 列 出 所 有 的 共享 内 存 信息 ， 结 果 如 图 11-13 所 示 。 
(5) ipcs-| 用 于 列 出 系统 的 限额 ， 结 果 如 图 11-14 所 示 。 
[sharexu@linux 1105]$ ipcs -m 

Shared Memory Segments 

shmid owner = : status 

0x0000162e 131072 sharexu - 
0x000004d2 163841 sharexu 


ipcs-m 命 令 执行 结果 图 





[sharexu@linux 1103]$ ipcs -l 


Shared Memory Limits 
number of segments = 4096 
seg size (kbytes) = 2097152 
total shared memory (kbytes) 
seg size (bytes) 


Semaphore Limit 
number of arrays 
semaphores per array = 5010 
semaphores system wide = 641280 
ops per semop call = 5018 
semaphore max value = 32767 


Messages: Limits 
max queues system wide = 972 
max size of message (bytes) 


default max size of queue (bytes) - 65536 


图 11-14 ipcs-] 命 令 执 行 结果 图 
(6) ipcs-t 用 于 列 出 最 后 的 访问 时 间 ， 结 果 如 图 11-15 所 示 。 


(7) ipcs-u 用 于 列 出 当前 的 使 用 情况 ， 结 果 如 图 11-16 所 示 。 
[sharexuglinux 1103]$ ipcs -t 


Shared Memory Attach/Detach/Change Times 
owner attached detached changed 
sharexu Jan 2 22:11:53 Jan 2 22:12:12 Jan avat 
163841 sharexu Jan 2 21:32:46 Jan 2 21:34:21 Jan 2 21:32:38 


Semaphore Operation/Change Times 
owner last-op ast-changed 
sharexu Sat Jan 2 20:55:22 2016 t Jan 2 20:55:22 2016 
98307 sharexu Sat Jan 2 22:12:12 2016 11:53 1 


------ Message Queues Send/Recv/Change Times 
msqid owner send recv 
98304 sharexu Not set Not set Jan 2 22:12:32 


图 11-15 ”ipcs-t 命 令 执行 结果 图 
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811-16. ipcs-u 命 令 执行 结果 图 








本 章 主要 介绍 了 管道 、 消 息 队 列 、 共 享 内 存 和 信号 量 的 使 用 方法 ， 它 们 各 有 各 的 特点 及 优势 ， 应 按照 实际 情况 ， 选 择 合适 的 方式 应 用 到 程序 中 。 


前 面 几 章 都 是 长 连接 的 内 容 ， 接 下 来 的 第 12 章 将 会 介绍 短 连 接 的 知识 。 


协议 是 指 计算 机 通信 网 络 中 两 台 计 算 机 之 间 进 行 通信 所 必须 共同 遵守 的 规定 或 规则 。HTTP (Hypertext Transfer Protocol， 超 文本 传输 协议 ) 是 一 种 详细 规定 了 浏览 器 和 万 维 网 (World Wide 
Web, WWW) 服务 器 之 间 互 相通 信 的 规则 ， 通 过 因特网 传送 万 维 网 文档 的 数据 传送 协议 。HTTP 协 议 可 以 使 浏览 器 更 加 高 效 地 运行 ， 使 网 络 传输 效率 更 高 。 它 不 仅 保证 计算 机 正确 快速 地 传输 超 文 本 文档 ， 
还 确定 传输 文档 中 的 哪 一 部 分 内 容 首先 显示 (如 文本 先 于 图 形 ) 等 。 














HTTP 由 于 其 灵活 、 简 单 、 快 速 的 特点 ， 应 用 非常 广泛 。 浏 览 网 页 是 HTTP 的 主要 应 用 ,但 是 这 并 不 代表 HTTP 就 只 能 应 用 于 网 页 的 浏览 。HTTP 是 一 种 协议 ， 只 要 通信 的 双方 都 遵守 这 个 协议 ，HTTP 就 
能 有 用 武之 地 ， 比 如 常用 的 QQ、 迅 雷 这 些 软件 ， 都 使 用 了 HTTP 协 议 。 





















































在 网 络 七 层 模型 中 ，HTTP 是 在 应 用 层 ， 也 就 是 在 传输 层 以 上 。 事 实 上 ，HTTP 是 基于 TCP 协 议 的 ; 而 我 们 常 说 的 HTTPS 协 议 ， 则 是 同 处 应 用 层 而 基于 TLS、SSL 协 议 层 之 上 的 协议 ， 两 者 的 区 别 如 图 12-1 
所 示 。 























HTTPS ( 应 用 层 ) 
TLS SSL (应 用 层 ) 


TCP ( 传输 层 





TCP ( 传输 层 


( 网络 层 ) 
数据 链 路 层 ( 又 称 网 络 接口 层 ) 数据 链 路 层 ( 又 称 网 络 接口 层 ) 





( 网 络 层 ) 














图 12-1 HTTP 协 议 与 HTTPS 协 议 的 对 比 





HTTP 默 认 的 端口 号 为 80，HTTPS 的 默认 端口 号 则 为 443。 

















HTTP 是 基于 传输 层 的 TCP 协 议 ， 而 TCP 是 一 个 端 到 端的 面向 连接 的 协议 。 所 谓 的 “ 端 到 端 ” 可 以 理解 为 进程 到 进程 之 间 的 通信 ， 所 以 HTTP 在 开始 传输 之 前 ， 首 先 需要 建立 TCP 连 接 ， 而 TCP 连 接 的 过 程 
需要 进行 “三 次 握手 。， 在 TCP 三 次 握手 之 后 ， 建 立 了 TCP 连 接 ， 此 时 HTTP 就 可 以 进行 传输 了 。 在 HTTP1.1 中 (通过 Connection 头 设置 ) 默认 在 HTTP 传 输 完成 后 不 断 开 TCP 连 接 。 在 此 之 前 的 版 本 HTTP 则 
默认 是 断 开 连接 ， 也 就 是 同一 个 客户 端的 这 次 请 求 和 上 次 请 求 是 没有 对 应 关系 的 。 




















一 次 HTTP 操 作 称 为 一 个 事务 ， 其 工作 过 程 可 分 为 以 下 4 步 。 














(1) 首先 客户 机 与 服务 器 需要 建立 连接 。 只 要 单 击 某 个 超级 链接 ，HTTP 的 工作 即 开始 。 


(2) 建立 连接 后 ， 客 户 机 发 送 一 个 请 求 给 服务 器 ， 请 求 方式 的 格式 为 : 统一 资源 标识 符 (URL) 、 协 议 版 本 号 ， 后 边 是 MIME 信 息 (包括 请 求 修饰 符 、 客 户 机 信息 和 可 能 的 内 容 ) 。 

















(3) 服务 器 接 到 请 求 后 ， 给 予 相应 的 响应 信息 ， 其 格式 为 一 个 状态 行 ， 包 括 信息 的 协议 版 本 号 、 一 个 成 功 或 错误 的 代码 ， 后 边 是 MIME 信 息 (包括 服务 器 信息 、 实 体 信息 和 可 能 的 内 容 ) 。 

















(4) 客户 端 接收 服务 器 所 返回 的 信息 通过 浏览 器 显示 在 用 户 的 显示 屏 上 ， 然 后 客户 机 与 服务 器 断 开 连接 。 















































如 果 在 以 上 过 程 中 的 某 一 步 出 现 错误 ， 那 么 产生 错误 的 信息 将 返回 到 客户 端 ， 由 显示 屏 输出 。 对 于 用 户 来 说 ， 这 些 过 程 是 由 HTTP 自 己 完成 的 ， 用 户 5 























鼠标 操作 ， 等 待 信息 显示 就 可 以 了 。 











pu 








HTTP 协 议 永 远 都 是 客户 端 发 起 请 求 ， 服 务 器 回 送 响应 ， 这 样 就 会 使 得 无 法 实现 客户 端 未 发 起 的 请 求 ， 而 服务 器 将 消息 推送 给 客户 端 。 





12.2 HTTP 协议 结构 


HTTP 协 议 无 论 是 请 求 报 文 还 是 回应 报 文 ， 都 分 为 以 下 4 个 部 分 。 









































(1) 报 文 头 (initial line) ， 上 面 的 例子 中 的 “GEThttp://www.baidu.com/favicon.ico HTTP/1.1” 表 示 用 GET 方 法 请 求 http://www.baidu.com/favicon.ico 这 个 文件 ， 用 的 是 HTTP/1.1 协 议 。 
(2) 0 个 或 多 个 请 求 头 (headerline) ， 例 如 Accept-Language: en. 

(3) 空 行 (作为 header lines 的 结束 ) 。 

(4) 可 选 的 消息 体 。 


HTTP 协 议 是 基于 行 的 协议 ,每 一 行 以 \r\n 作 为 分 隔 符 。 报 文 头 通常 表明 报 文 的 类 型 (例如 请 求 类 型 ) ， 且 报 文 头 只 占 一 行 ; 请 求 头 附带 一 些 特殊 信息 ， 每 一 个 请 求 头 占 一 行 ， 其 格式 为 name: value, 
即 以 分 号 作为 分 隔 ， 空 行 也 就 以 一 个 \r\n 分 隔 ; 可 选 body 通 常 包含 数据 ， 例 如 服务 器 返回 的 某 个 静态 HTML 文 件 的 内 容 。 
































wireshark 是 一 个 抓 包 的 好 工具 ， 它 能 够 记录 计算 机 和 互联 网 之 间 的 通信 内 容 。 此 处 将 用 wireshark 抓 一 个 包 来 进行 分 析 。 

















先 打开 wireshark， 并 开启 过 滤器 ， 只 抓 80 端 口上 的 包 ， 如 图 12-2 所 示 。 











图 12-2 在 wireshatk 的 过 滤器 窗口 中 输入 tcp.port=80 





在 浏览 器 的 地 址 栏 中 输入 “http://www.baidu.com/favicon.ico”， 会 看 到 wireshark 中 抓 到 了 这 个 包 ， 如 图 12-3 所 示 。 











Ts as e ecmvruv Lany seyme menmi a nee 
34020300 192,168.31. 14.215.177.38 616 GET /favicon.ico HTTP/1.1 

34684800 14. 215.177. 192.168.31.194 54 80-52239 [ACK] Seq-1 Ack-563 win-25984 Len-0 
34822900 14. 215.177. 192.168.31.19% 354 [TCP segment of a reassembled PDU] 

34859000 14. 215.177. 192.168,31.194 1146 HTTP/1.1 200 OK (image/x-icon) 

34860700 192.168. 31. 14.215.177.38 54 52239-80 [ACK] Seq-563 Ack-1393 win-15888 Len-0Ü 


W Frame 3615: 616 bytes on wire (4928 bits), 616 bytes captured (4928 bits) on interface 0 

W Ethernet II, Src: Tp-LinkT 27:bl:da (5c:63:bf:27:b1:da), Dst: XiaomiTe 2d:ed:77 (Ec:be:be:2d:ed:77) 
加 Internet Protocol Version 4, Src: 192.168.31.194 (192.168.31.194), Dst: 14.215.177.38 (14.215.177.38) 
m Transmission Control Protocol, Src Port: 52239 (52239), Dst Port: 80 (80), Seq: 1, Ack: 1, Len: 562 
B 


日 
a [Expert Info (Chat/Sequence): GET /favicon.ico HTTP/1.1\r\n] 

[cET /favicon.ico HTTP/1.1\r\n] 
[severity level: chat] 
[Group: Sequence] 

Request Method: GET 

Request URI: /favicon.ico 

Request Version: HTTP/1.1 


HOST: www.baldu.com rn 
connection: keep-alive\r\n 
Accept: text/html ,application/xhtml+xm] , application/xml; q-0.9, image /webp , */*; q-0. 8\r\n 
Upgrade-Insecure-Requests: 1\r\n 
User-Agent: Mozilla/5.0 (windows NT 6.1; WOW64) ApplewebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36 rn 
Accept-Encoding: gzip, deflate, sdchirin 
Accept-Language: zh-CN,zh;q-0.8\r\n 
Cookie: BAIDUID-EBBO2BDF9C7E00180475F119D184E4F3:FG-1; 6IDUPSTD=E66026DF9C7E00160475F1190D164E4F3; P5TM-1432975547; sug-3; sugstore-0; ORIGIN-2; bdime=0; MCITY=-%3A; H_PS_WBANNER=5\r\n 
Cookie pair: BAIDUID-FBBO2BDF9C7E00180475F119D1B4F4F3:FG-1 
Cookie pair: BIDUPSID-EBBO2BDE9C7TEO001B047 5F119D1B4E4F3 
Cookie pair: PSTW-1432075547 
cookie pair: sug-3 
cookie pair: sugstore-o 


Cookie pair: bdime-O0 
Cookie pair: MCITY--XJA 
Cookie pair: H PS WBANNER-5 


Nr^n 

[Eul] request URI: http://www. baidu. com/favicon. icol 
[HTTP request 1/1] 
[Response in frame: 3622] 

















图 12-3 访问 百度 icon 文 件 时 用 wireshatk 抓 包 结果 图 








图 12-3 中 看 不 清 请 求 包 的 具体 内 容 ， 请 求 包 的 具体 内 容 如 图 12-4 所 示 。 











[Expert Info (chat/sequence): GET /favicon.ico HTTP/1.1*r^n] 
[GET /favicon.ico HTTP/1.1*r^n] 
[severity level: chat] 
[Group: Sequence] 
Request Method: GET 
Request URI: /favicon.ico 
Request Version: HTTP/1.1 
Host: ww. baidu. com\r\n 
Connection: keep-alive\r\n 
Accept: text/html,application/xhtml«xml ,application/xml; q-0. 9, image/webp, */*; q-0. 8\r\n 
Upgrade-Insecure-Requests: 1\r\n 
User-Agent: Mozilla/5.0 (windows NT 6.1; WOW64) ApplewebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36*r^n 
Accept-Encoding: gzip, deflate, sdch\r\n 
Accept-Language: zh-CN, zh; q=0. 8\r\n 
Ej Cookie: BAIDUID-EBBO2BDF9C7E001B0475F119D1B4E4F3:FG-1; BIDUPSID=EBB02BDF9C7E00180475F119D184E4F3; PSTM-1432975547; sug=3; sug: 
Cookie pair: BAIDUID-EBBO2BDF9C7E001B0475F119D1B4E4F3:FG-1 
Cookie pair: BIDUPSID-EBBO2BDF9C7E001B047 5F119D184E4F3 
Cookie pair: PSTM-1432975547 
Cookie pair: sug-3 
Cookie pair: sugstore-O0 
| okie pair: R m— 
| Cookie pair: bdime=0 
Cookie pair: MCITY=-%3A 
Cookie pair: H.PS WBANNER-5 
\r\n 
[Full request URI: http://www. baidu. com/favicon. ico] 
[HTTP request 1/1] 
Response in frame: 3622] 





图 12-4 访问 百度 icon 文 件 请 求 包 内 容 


可 以 看 到 第 一 行 是 : 





GET /favicon.ico HTTP/1.1\r\n 





这 个 表明 用 GET 方 法 ，HTTP/1.1 协 议 获 取 favicon.ico 文 件 。 

1.HTTP 请 求 方法 

HTTP/1.1 协 议 中 共 定 义 了 9 种 方法 (有 时 也 叫 “ 动 作 ”) 来 表明 Request-URI 指 定 的 资源 的 不 同 操作 方式 ， 如 下 所 述 。 

(1) OPTIONS: 返回 服务 器 针对 特定 资源 所 支持 的 HTTP 请 求 方法 ;也 可 以 利用 向 Web 服 务 器 发 送 “*” 的 请 求 来 测试 服务 器 的 功能 性 。 


(2) HEAD: 向 服务 器 索要 与 GET 请 求 相 一 致 的 响应 ， 只 不 过 响应 体 将 不 会 被 返回 。 这 一 方法 可 以 在 不 必 传输 整个 响应 内 容 的 情况 下 ， 就 可 以 获取 包含 在 响应 消息 头 中 的 元 信息 。 该 方法 常用 于 测试 超 
链接 的 有 效 性 ， 是 否 可 以 访问 ， 以 及 最 近 是 否 更 新 等 信息 。 


(3) GET: 向 特定 的 资源 发 出 请 求 。 注 意 : GET 方 法 不 应 当 被 用 于 产生 “副作用 ”的 操作 中 ， 例 如 在 web app. 中 的 应 用 ， 其 中 一 个 原因 是 GET 可 能 会 被 网 络 蜂 蛛 等 随意 访问 。 





(4) POST: 向 指定 资源 提交 数据 进行 处 理 请 求 〈 例 如 提交 表单 或 者 上 传 文件 ) 。 数 据 被 包含 在 请 求 体 中 。POST 请 求 可 能 会 导致 新 的 资源 的 建立 或 对 已 有 资源 的 修改 。 
(5) PUT: 向 指定 资源 位 置 上 传 其 最 新 内 容 。 


(6) DELETE: 请 求 服务 器 删除 Request-URI 所 标识 的 资源 。 























(7) TRACE: 回 显 服务 器 收 到 的 请 求 ， 主 要 用 于 测试 或 诊断 。 


(8) CONNECT: HTTP/1.1 协 议 中 预 留 给 能 够 将 连接 改 为 管道 方式 的 代理 服务 器 。 





(9) PATCH: 用 来 将 局 部 修改 应 用 于 某 一 资源 ， 该 操作 添加 于 规范 RFC5789 中 。 








方法 名 称 是 区 分 大 小 写 的 。 当 某 个 请 求 所 针对 的 资源 不 支持 对 应 的 请 求 方法 时 ， 服 务 器 应 当 返 回 状态 码 405 (Method Not Allowed) ; 当 服 务 器 不 认识 或 者 不 支持 对 应 的 请 求 方法 时 ， 应 当 返 回 状态 


码 501 (Not Implemented) 。 











HTTP 服 务 器 至 少 应 该 实现 GET 和 HEAD 方 法 ， 其 他 方法 都 是 可 选 的。 此 外 ， 除 了 上 述 方法 ， 特 定 的 HTTP 服 务 器 还 能 够 扩 


2.HTTP 常 见 的 请 求 头 





RE 





定义 的 方法 。 
































Rc 


在 HTTP/1.1 协 议 中 ， 所 有 的 请 求 头 〈 除 Host 外 ) 都 是 可 选 的 。 这 里 先 把 前 面 抓 到 的 包 的 请 求 头 及 其 作用 列举 一 下 ， 请 求 信息 里 的 请 求 头 内 容 如 下 所 示 : 














Host: www.baidu.com\r\n 

Connection: keep-alive\r\n 

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8\r\n 
Upgrade-Insecure-Requests: 1\r\n 


User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.111 Safari/537.36\r\n 


Accept-Encoding: gzip, deflate, sdch\r\n 
Accept-Language: zh-CN,zh;q=0.8,en;q=0.6\r\n 



































Host: “(发 送 请 求 时 ， 该 请 求 头 是 必 














需 的 ) 主要 用 于 指定 被 请 求 资源 的 Internet 主 机 和 端口 号 ， 它 通常 从 HTTP URL 中 提取 出 来 的 。HTTP/1.1 请 求 必 须 包 含 主机 头 域 ， 否 则 系统 会 以 400 状 态 码 返回 。 


























例如 上 面 的 例子 中 ， 在 浏览 器 中 输入 “http://www.baidu.com/favicon.ico” 后 ,浏览 器 发 送 的 请 求 消息 中 ， 就 会 包含 Host 请 求 头 域 “Host: http://www.baidu.com” ， 此 处 使 用 默认 端口 号 80， 若 指定 








E 


了 端口 号 ， 则 变 成 : "Host: 指定 端口 号 ”。 




















Connection: 它 的 值 通常 只 有 两 个 ，keep-alive 和 close。HTTP 是 一 个 请 求 响应 模式 的 典型 范例 ， 即 客户 端 向 服务 器 发 送 一 个 请 求 信息 ， 服 务 器 来 


向 应 这 个 信息 。 在 之 前 的 HTTP 版 本 中 ， 每 个 请 求 都 














将 被 创建 一 个 新 的 客户 端 到 服务 器 的 连接 ， 在 这 个 连接 上 发 送 请 求 ， 然 后 接收 请 求 。 这 样 的 模式 有 一 个 很 大 的 优点 就 是 简单 ， 很 容易 理解 和 编程 实现 ; 但 也 有 一 个 很 大 的 缺点 就 是 效率 很 低 ， 因 此 keep- 
alive 被 提出 用 来 解决 效率 低 的 问题 。keep-alive 使 客户 端 到 服务 器 端的 连接 持续 有 效 ， 当 出 现 对 服务 器 的 后 继 请 求 时 ，keep-alive 避 免 了 建立 或 者 重新 建立 连接 。 市 场 上 的 大 部 分 Web 服 务 器 ， 包 括 
























































iPlanet、lIS 和 Apache 等 ， 都 支持 HTTP 的 keep-alive 功 能 。 对 于 提供 静态 内 容 的 网 站 来 说 ， 这 个 功能 通常 很 有 用 ; 但 是 对 于 









































负担 较 重 的 网 站 来 说 ， 这 里 存在 另外 一 个 问题 : 虽然 为 客户 保留 打开 的 连接 有 一 























定 的 好 处 ， 但 它 同 样 影响 了 性 能 ， 因 为 在 处 理 暂 停 期 间 ， 本 来 可 以 释放 的 资源 仍旧 被 占用 。 当 Web 服 务 器 和 应 用 服务 器 在 同一 台 机 器 上 运行 时 ，keep-alive 功 能 对 资源 利用 的 影响 尤其 突出 。 此 功能 为 








HTTP/1.1 预 设 的 功能 ，HTTP/1.0 加 上 keep-aliveheader 也 可 以 提供 HTTP 的 持续 作用 功能 。 














Accept: 浏览 器 端 可 以 接收 的 MIME 类 型 。 例 如 : Accept: text/html 代 表 浏 览 器 可 以 接收 服务 器 回 发 的 类 型 为 text/htm 





Cache-Control: 指定 请 求 和 响应 遵循 的 缓存 机 制 。 缓 存 指令 是 单 向 的 (响应 中 出 现 的 缓存 指令 在 请 求 中 未 必 会 出 现 ) ， 


， 也 就 是 我 们 常 说 的 html 文 档 ， 如 果 服 务 器 无 法 返回 text/html 类 型 的 数据 ， 
服务 器 应 该 返回 一 个 406 错 误 (non acceptable) 。 通 配 符 (*) 代表 任意 类 型 ， 例 如 Accept: */* 代 表 浏 览 器 可 以 处 理 所 有 类 型 (一 般 浏览 器 都 会 发 给 服务 器 该 语句 ) 。 























消息 处 理 过 程 中 的 缓存 处 理 过 程 ) 。 请 求 时 的 缓存 指令 包括 no-cache、no-store、max-age、max-stale、min-fresh、only-if-cached， 响 应 消息 中 的 


no-transform, must-revalidate, proxy-revalidate, max-age, s-maxage&, 


Cache-Control: Public 指 可 以 被 任何 缓存 所 缓存 ;Private 指 内 容 只 缓存 到 私有 缓存 中 ; no-cache 指 所 有 内 容 都 不 会 被 缓存 ;no-store 用 于 防止 重 : 





是 独立 的 (在 请 求 消息 或 响应 消息 中 设置 Cache-Control 并 不 会 修改 另 一 个 


指令 包括 public、private、no-cache、no-store、 























的 信息 被 无 意 的 发 布 ， 在 请 求 消息 中 发 送 将 使 得 请 


求 和 响应 消息 都 不 使 用 缓存 ; max-age 指 示 客 户 机 可 以 接收 生存 期 不 大 于 指定 时 间 (以 s 为 单位 ) 的 响应 ;min-fresh 指 示 客户 机 可 以 接收 响应 时 间 小 于 当前 时 间 加 上 指定 时 间 的 响应 ;max-stale 指 示 客户 
机 可 以 接收 超出 超时 期 间 的 响应 消息 ， 如 果 指定 max-stale 消 息 的 值 ， 那 么 客户 机 可 以 接收 超出 超时 期 指定 值 之 内 的 响应 消息 。 




















Accept-Encoding: 浏览 器 声明 自己 可 接收 的 编码 方法 ， 通 常 说 明 是 否 支持 压缩 并 指定 压缩 方法 ; Servlet 能 够 向 支持 gzip 的 浏览 器 返回 经 gzip 编 码 的 HTML 页 面 。 许 多 情形 下 这 可 以 减少 5~10 倍 的 下 载 
时 间 。 例 如 : Accept-Encoding: gzip，deflate。 如 果 请 求 消息 中 没有 设置 这 个 域 ， 服 务 器 假定 客户 端 对 各 种 内 容 编 码 都 可 以 接受 。 


























Accept-Language: 浏览 器 声明 自己 接收 的 语言 。 语 言 跟 字符 集 的 区 别 可 以 理解 为 : 中 文 是 语言 ， 中 文 有 多 种 字符 集 ， 比 如 big5、gb2312、gbk 等 ; 例如 : Accept-Language: en-us。 如 果 请 求 消 








息 中 没有 设置 这 个 报头 域 ， 则 服务 器 假定 客户 端 对 各 种 语言 都 可 以 接受 。 

















Accept-Charset: 浏览 器 可 接受 的 字符 集 。 如 果 在 请 求 消息 中 没有 设置 这 个 域 ， 默 认 时 表示 任何 字符 集 都 可 以 接受 。 

















User-Agent: 用 于 告诉 HTTP 服 务 器 ， 客 户 端 使 用 的 操作 系统 和 浏览 器 的 名 称 和 版 本 。 











3148 3.80269600 192.168. 31.194 4.215.177.38 
3149 3.81409800 14.215.177.38 192.168.31.194 


3150 3.81414100 192.168. 31.194 14.215.177.38 
3151 3. 8152290014.215.177.38 192.168.31.194 
3152 3.81588300 14.215.177.38 192.168. 31.194 














729 GET /fav 
66 80-53441 
54 53441-80 
54 80-53427 

222 HTTP/1.1 


上 面 已 经 访问 了 一 次 http://www.baidu.com/favicon.ico， 在 不 清除 浏览 器 缓存 的 情况 下 ， 如 果 再 访问 一 次 ， 可 以 看 到 返回 码 是 304， 如 图 12-5 所 示 。 


icon. ico HTTP/1.1 
[SYN, ACK] Seq=0 Ack=1 W 
[acK] Seq=1 Ack=1 win=17 
[ACK] Seq-1 Ack=676 win- 
304 Not Modified 





图 12-5” 非 首次 访问 一 个 未 修改 的 资源 文件 的 返回 值 是 304 

















也 可 以 来 对 比 下 这 前 后 两 个 请 求 包 中 的 请 求 信息 ， 第 一 个 如 图 12-4 所 示 ， 第 二 个 如 图 12-6 所 示 。 








- Hypertext Transfer Protocol — 0000000000000 00 0 0 0000000000000 
- GET /favicon.ico HTTP/1.1Arn ———— 0000000000000 
日 [Expert info (chat/Sequence): GET /favicon.ico HTTP/1.1\r\n] 
[GET /favicon.ico HTTP/1.1\r\n] 
[severity level: chat] 
[Group: Sequence] 
Request method: GET 
Request URI: /favicon.ico 
Request version: HTTP/1.1 
Host: ww. baidu. com\r\n 
connection: keep-alive\r\n 
cache-control: max-age=0\r\n 
Accept: text/html,application/xhtml«xml,application/xml; q-0.9,image/webp,*/*;q-0.8Mr^n 
Upgrade-Insecure-Requests: 1\r\n 
User-Agent: Mozilla/5.0 (windows NT 6.1; WOW64) ApplewebKit/537.36 (KHTML, like Gecko) ch 
Accept-Encoding: gzip, deflate, sdch\r\n 
Accept-Language: zh-CN, zh; q=0. 8\r\n 
[truncated]Cookie: BAIDUID-EBBO2BDF9C7E00180475F119D1B4E4F3:FG-1; BIDUPSID-EBBO2BDF9C7EO 
If-None-Match: "1636-4d69bd3a62a80"r^n 
If-Modified-Since: Tue, 26 Feb 2013 07:44:26 GMT\r\n 
\r\n 
[Full request URI: http://www. baidu. com/favicon. ico] 


[HTTP request 1/2] 


[Response in frame: 2053] 











12-6” 非 首次 访问 资源 文件 请 求 包 内 容 图 











可 见 ， 第 二 个 请 求 包 中 的 内 容 ， 比 第 一 个 多 了 以 下 两 行 : 





If-None-Match: "1636-4d69bd3a62a80"Nr^n 
If-Modified-Since: Tue, 26 Feb 2013 07:44:26 GMT\r\n 

















If-Modified-Since: 把 浏览 器 端 缓存 页 面 的 最 后 修改 时 间 发 送 到 服务 器 去 ， 服 务 器 会 把 这 个 时 间 与 服务 器 上 实际 文件 的 最 后 修改 时 间 进 行 对 比 。 如 果 时 间 一 致 ， 那 么 返回 304 状 态 ， 客 户 端 就 直接 使 
本 地 缓存 文件 如果 时 间 不 一 致 ， 就 会 返回 200 状 态 和 新 的 文件 内 容 。 客 户 端 接 到 之 后 ， 会 丢弃 | 日 文件 ， 把 新 文件 缓存 起 来 ， 并 显示 在 浏览 器 中 。 

















If-None-Match: If-None-Match 和 ETag 一 起 工作 ， 工 作 原 理 是 在 HTTP Response 中 添加 ETag 信 息 。 当 用 户 再 次 请 求 该 资源 时 ， 将 在 HTTP Request 中 加 入 If-None-Match 信 息 (ETag 的 值 ) 。 如 果 
服务 器 验证 资源 的 ETag 没 有 改变 (该 资源 没有 更 新 ) ， 将 返回 一 个 304 状 态 告诉 客户 端 使 用 本 地 缓存 文件 。 和 否则 将 返回 200 状 态 和 新 的 资源 和 Etag。 使 用 这 样 的 机 制 可 以 提高 网 站 的 性 能 。 























我 们 再 来 看 下 其 他 常见 的 请 求 头 : 























Pragma: 指定 no-cache 值 表示 服务 器 必须 返回 一 个 刷新 后 的 文档 ， 即 使 它 是 代理 服务 器 而 且 已 经 有 了 页 面 的 本 地 拷贝 ; 在 HTTP/1.1 版 本 中 ， 它 和 Cache-Control: no-cache 作 用 一 模 一 样 。Pargma 
只 有 一 个 用 法 ， 例 如 : Pragma: no-cache。 注 意 : 在 HTTP/1.0 版 本 中 ， 只 实现 了 Pragema: no-cache 功 能 ， 没 有 实现 Cache-Control 功 能 。 


Content-Type， 例 如 : Content-Type: application/x-www-form-urlencoded。 


Referer: 包含 一 个 URL， 用 户 从 该 URL 代 表 的 页 面 出 发 访问 当前 请 求 的 页 面 。 提 供 了 Request 的 上 下 文 信息 的 服务 器 ， 告 诉 服务 器 其 是 从 哪个 链接 转 过 来 的 。 比 如 从 个 人 主页 上 链接 到 一 个 朋友 那里 ， 
对 方 的 服务 器 就 能 够 从 HTTP Referer 中 统计 出 每 天 有 多 少 用 户 通过 单 击 我 主页 上 的 链接 访问 他 的 网 站 。 例 如 : Referer: http://translate.google.cn/? hl=zh-cn&tab=wT。 























Cookie: 最 重要 的 请 求 头 之 一 ， 用 于 将 cookie 的 值 发 送 给 HTTP 服 务 器 。 


Content-Length: 表示 请 求 消息 正文 的 长 度 。 例 如 : Content-Length: 38。 























Authorization: 授权 信息 ， 通 常 出 现在 对 服务 器 发 送 的 WWW-Authenticate 头 的 应 答 中 。 主 要 用 于 证 明 客户 端 有 权 查 看 某 个 资源 。 当 浏览 器 访问 一 个 页 面 时 ， 如 果 收 到 服务 器 的 响应 代码 为 401 (未 
授权 ) ， 可 以 发 送 一 个 包含 Authorization 请 求 报头 域 的 请 求 ， 要 求 服务 器 对 其 进行 验证 。 


UA-Pixels, UA-Color. UA-OS, UA-CPU: 由 某 些 版 本 的 下 浏览 器 所 发 送 的 非 标准 的 请 求 头 ， 表 示 屏 幕 大 小 、 颜 色 深度 、 操 作 系统 和 CPU 类 型 。 





From: 请 求 发 送 者 的 E-mail 地 址 ， 由 一 些 特殊 的 Web 客 户 程序 使 用 ， 浏 览 器 一 般 不 会 用 到 它 。 


Range: 可 以 请 求实 体 的 一 个 或 者 多 个 子 范围 。 例 如 ， 表 示 头 500 个 字 节 : bytes=0-499; 表示 第 二 个 500 字 节 : bytes=500-999; 表示 最 后 500 个 字 节 : bytes=-500; 表示 500 字 节 以 后 的 范围 : 
bytes=500-; 第 一 个 和 最 后 一 个 字 节 : bytes=00/-1; 同时 指定 几 个 范围 : bytes=500-600、601-999。 但 是 服务 器 可 以 忽略 此 请 求 头 ， 如 果 无 条 件 GET 包 含 Range 请 求 头 ， 响 应 会 以 状态 码 
206 (PartialContent) 返回 而 不 是 200 (OK) 。 














3.HTTP 回 应 报 文 





先 来 看 下 访问 http://www.baidu.com/favicon.ico 得 到 的 返回 包 内 容 ， 如 图 12-7 所 示 。 











HTTP 官 方 事先 定义 ， 例 如 200 表 示 成 功 、404 表 示 资 源 不 存在 等 ; 最 后 一 个 字段 为 status code 的 可 读 字符 串 。 


- Hypertext Transfer Protocol —— 
cHITP/I.1200 OXWAn 0 a 
€ [Expert info (chat/Sequence): HTTP/1.1 200 OK\r\n] 
[HTTP/1.1 200 oK\r\n] 
[severity level: chat] 
[Group: Sequence] 
Request Version: HTTP/1.1 
Status Code: 200 
Response Phrase: OK 
Date: Sun, 31 Jan 2016 08:12:55 GMT\r\n 
Server: Apache\r\n 
Last-Modified: Tue, 26 Feb 2013 07:44:26 GMT\r\n 
ETag: "1636-4d69bd3a62a80"Xr^n 
Accept-Ranges: bytes\r\n 
vary: Accept-Encoding,User-Agent'r^n 
Content-Encoding: gzip\r\n 
Content-Length: 1092 ^r^n 
[Content length: 1092] 
Connection: Keep-Alive\r\n 
Content-Type: image/x-icon\r\n 
\r\n 
[HTTP response 1/1] 
[Time since request: 0.008387000 seconds] 
[Request in frame: 3615] 
content-encoded entity body (gzip): 1092 bytes -> 5686 bytes 
& Media Type 
Media Type: image/x-icon (5686 bytes) 








图 12-7 访问 图 片 请 求 包 内 容 图 








因为 访问 的 内 容 是 一 张 图 片 ， 所 以 media type 是 image。 





第 一 行 是 报 文 头 ， 第 一 个 字段 表明 HTTP 协 议 版 本 ， 可 以 直接 以 请 求 报 文 为 准 〈 即 请 求 报 文 版 本 是 多 少 这 里 就 是 多 少 ) ; 第 二 个 字段 是 一 个 status code， 也 就 是 返回 码 ， 相 当 于 请 求 结果 ， 请 求 结果 被 























返回 码 由 3 位 数字 组 成 ， 第 一 个 数字 定义 了 响应 的 类 别 ， 且 有 5 种 可 能 的 取 值 。 
(1) 1xx: 指示 信息 ， 表 示 请 求 已 接收 ， 继 续 处 理 。 
(2) 2xx: 成 功 ， 表 示 请 求 已 被 成 功 接收 、 理 解 、 接 受 。 


(3) 3xx: 重 定向 ， 要 完成 请 求 必须 进行 更 进一步 的 操作 。 





(4) 4xx: 客户 端 错误 ， 请 求 有 语法 错误 或 请 求 无 法 实现 。 


(5) 5xx: 服务 器 端 错误 ， 服 务 器 未 能 实现 合法 的 请 求 。 





常见 返回 码 和 其 状态 描述 说 明 如 下 : 





200 OK // 客户 端 请 求 成 功 

400 Bad Request // 客户 端 请 求 有 语法 错误 ， 不 能 被 服务 器 所 理解 

401 Unauthorized // 请 求 未 经 授权 ， 这 个 状态 代码 必须 和 WWW-Authenticate 报 头 域 一 起 使 用 
403 Forbidden // 服务 器 收 到 请 求 ， 但 是 拒绝 提供 服务 

404 Not Found // 请 求 资 源 不 存在 ， 比 如 : 输入 了 错误 的 URL 

500 Internal Server Error // 服务 器 发 生 不 可 预期 的 错误 

503 Server Unavailable // 服务 器 当前 不 能 处 理 客户 端的 请 求 ， 一 段 时 间 后 可 能 恢复 正常 








K 








Date: 表示 消息 发 送 的 时 间 ， 时 间 的 描述 格式 由 rfc822 定 义 。 例 如 ，Date: Sun, 31 Jan 201608: 12: 55 GMT\r\n。Date 描 述 的 时 间 表 示 世 界 标准 时 ， 换 算 成 本 地 时 间 ， 需 要 知道 用 户 所 在 的 时 














Server: 指明 Web 服 务 器 用 来 处 理 请 求 的 软件 信息 。 例 如 : Server: Microsoft-11S/7.5, Server: Apache-Coyote/1.1。 








Accept-Ranges: Web 服 务 器 表明 自己 是 否 接收 获取 其 某 个 实体 的 一 部 分 (比如 文件 的 一 部 分 ) 的 请 求 。bytes 表 示 接 收 ，none 表 示 不 接收 。 








Vary: Web 服 务 器 用 该 头 部 的 内 容 告诉 Cache 服 务 器 ， 在 什么 条 件 下 才能 用 本 响应 所 返回 的 对 象 响应 后 续 的 请 求 。 假 如 源 Web 服 务 器 在 接 到 第 一 个 请 求 消息 时 ， 其 响应 消息 的 头 部 为 : 

















Content-Encoding: gzip; Vary: Content-Encoding 








那么 Cache 服 务 器 会 分 析 后 续 请 求 消息 的 头 部 ， 检 查 其 Accept-Encoding， 是 否 跟 先前 响应 的 Vary 头 部 值 一 致 ， 即 是 否 使 用 相同 的 内 容 编码 方法 ， 这 样 就 可 以 防止 Cache 服 务 器 将 自己 Cache 里 面 压缩 


后 的 实体 响应 传递 给 不 具备 解压 能 力 的 浏览 器 。 例 如 : Vary: Accept-Encoding。 


Content-Encoding: Web 服 务 器 表明 自 
Content-Length: Web 服 务 器 告诉 浏览 器 


Content-Type: Web 服 务 器 告诉 浏览 器 自己 | 


123 HTTPS 


在 网 络 上 ， 两 个 实体 之 间 的 通信 会 
据 的 安全 性 成 了 一 个 永恒 的 课题 。 一 句 


初级 的 防御 手段 ， 是 双方 都 约定 一 个 加 密 的 
要 讲 下 两 个 概念 ， 对 称 加 密 和 非 对 称 放 
钥 和 解密 的 密 钥 是 不 一 样 的 ， 也 就 是 密 钥 成 对 出 现 CS 
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"m 

















X, 











使 











了 什么 压缩 方法 (gzip, deflate) 压缩 响应 中 的 对 象 。 














响应 的 对 象 的 长 度 。 

















向 应 的 对 象 的 类 型 。 














面临 什么 样 的 安全 问题 呢 ? 最 常见 的 是 被 窃听 ， 只 
话说 得 很 好 ， 当 你 学 习 网 络 安全 后 ， 你 发 现 网 络 再 也 不 安全 了 。 














jk, i8 
密 : @@ 对 称 加 密 是 指 力 








密 的 密 铀 和 解密 的 密 钥 是 一 样 的 ， 通 常 使 





















































非 对 称 加 密 





法 得 出 密 铀 ， 再 








对 称 加 密 








届 公 钥 无 法 推 知 私 铀 ， 根 据 私 钥 也 无 法 推 知 公 铜 ) ， 加 密 解密 使 
的 有 RSA、ECC 算 法 等 。 基 于 性 能 的 考虑 ， 一 般 使 





























你 的 数据 在 网 络 上 传输 ， 就 有 可 能 被 窃听 ， 窃 听 者 可 能 把 窃听 到 的 数据 进行 臭 改 、 伪 造 ， 再 传送 给 下 一 个 人 。 数 





密 后 的 数据 进行 传输 ， 收 到 数据 方 再 进行 解密 。 但 更 高 级 的 方法 是 ， 公 开 代码 、 算 法 、 协 议 ， 通 过 密 钥 的 私密 性 来 保证 数据 传输 的 安全 性 。 这 里 
的 有 AES 和 TEA 算 法 ， 它 的 特点 是 计算 量 小 ， 又 有 一 定 的 破解 门槛 ，@ 而 非 对 称 加密 则 是 指 加 密 的 密 
不 同 密 钥 ( 公 钥 加 密 需要 私 钥 解 密 ， 私 钥 加 密 需要 公 钥 解 密 ) ， 它 的 特点 是 计算 量 
法 对 消息 内 容 进行 加 密 ， 然 后 再 进行 传输 。 


HTTP 协 议 可 以 轻松 抓 包 并 获得 其 中 的 内 容 ， 是 一 个 不 安全 的 协议 ,而 HTTPS (Hypertext Transfer Protocol over Secure Socket Layer) 则 是 以 安全 为 目标 的 HTTP 通 道 ， 简 单 来 讲 是 HTTP 的 安全 














版 。HTTPS 的 安全 


























HTTP 的 默认 端 
面 。 





1.TLS 


础 是 TLS (SSL 
及 一 个 加 密 /身份 验证 层 (在 HTTP 与 TCP 之 间 ) 。 这 个 系统 的 最 初 


的 升级 版 )。 它 是 一 个 U 
































TLS 协 议 可 | 











于 保护 正常 运行 于 TCP 之 上 的 任何 应 上 











议 无 关 的 。 高 层 的 





应 








E 
云 | 

















协议 的 通信 ， 如 HTTP、FTP、SMTP 或 Telnet 等 高 





协议 能 透明 地 建立 于 TLS 协 议 之 上 。 


RI scheme (抽象 标识 符 体系 ) ， 句 法 类 同 HTTP 体 系 ， 用 于 安全 的 HTTP 数 据 传输 。HTTPS: URL 表 明 它 使 用 了 HTTPS， 但 HTTPS 的 存在 不 


同 于 








的 应 用 协议 的 通信 ， 最 常见 的 是 用 TLs 来 保护 HTTP 的 通信 











TLS 协 议 在 应 








sti 








议 之 前 就 已 经 完成 加 密 算法 、 通 信 密 钥 的 协商 以 及 服务 器 的 认证 工作 。 在 此 之 后 应 








层 协议 所 传送 的 数据 都 会 被 加 密 ， 从 而 保证 通信 的 安全 性 





及 CA 根 证 书 ， 允 许 客户 端 、 服 务 器 端 以 一 种 不 能 被 偷 听 的 方式 通信 ， 在 通信 双方 间 建 立 起 一 条 安全 的 、 可 信任 的 通信 通道 。 


TLS 的 工作 流程 如 





网 











12-8 所 示 。 


网 景 公司 进行 研发 ， 提 供 了 身份 验证 与 加 密 通 信 方 法 ， 现 在 它 被 广泛 用 于 万 维 网 上 安全 敏感 的 通信 ， 例 如 交易 支付 


。TLS 协 议 的 优点 在 


。TLS 协 议 使 





方 

















层 协 








它 是 与 应 F 




















通信 双方 的 客户 证 书 以 


浏览 器 | 客户 端的 浏览 器 向 服务 跨 传 送 客户 端 SSL 协 


议 的 版 本 号 ， 加 密 算 法 的 种 类 ， 产生 的 随机 
数 ， 以 及 其 他 服务 器 和 客户 端 之 问 通信 所 需 
要 的 各 种 信息 





服务 器 问 客户 端 传送 SSL 协议 的 版 本 号 ， 加 


密 算法 的 种 类 ， 随 机 数 以 及 其 他 相关 信息 ，” 
同时 服务 器 还 将 向 客户 端 传 送 自 己 的 证 书 


(CD 客户 利用 服务 器 传 过 来 的 信息 验证 服务 器 的 合法 性 


用 户 端 随机 产生 一 个 用 于 后 面 通信 的 “对 称 
weg". 然后 用 服务 器 的 公 乌 (服务 器 的 公 
包 从 服务 器 的 证 书 中 获得 ) 对 其 加 密 ， 然 后 
将 加 密 后 的 “ 预 主 密码 ” 传 给 服务 器 


如 果 服务 器 要 求 客户 的 身份 认证 (在 握手 过 程 中 为 
可 选 ) ， 用 户 可 以 建立 一 个 随机 数 然后 对 其 进行 数 
据 签名 ， 将 这 个 含有 签名 的 随机 数 和 客户 自己 的 证 
以 及 加 密 过 的 “ 预 主 密码 ”一 起 传 给 服务 器 

返回 验证 是 否 


客户 端 向 服务 器 端 发 出 信息 ， 指 明 后 面 的 数 
据 通 信 将 本 步 又 中 的 主 密码 为 对 称 密 钥 , 同 
时 通知 服务 器 客户 端的 握手 过 程 结束 


服务 器 问 客户 端 发 出 信息 ， 通 知客 户 端 服务 
_ 器 端的 握手 过 程 结束 


| 


图 12-8 TLS 工作 流程 


服务 器 


服务 
HE 15 
数 的 


| 


器 检验 客户 
和 等 名 随机 


合法 性 


TLS 协 议 既 用 到 了 公 钥 加 密 技术 又 用 到 了 对 称 加 密 技术 ， 对 称 加 密 技术 虽然 比 公 钥 加 密 技术 的 速度 快 ， 可 是 公 钥 加 密 技术 提供 了 更 好 的 身份 认证 技术 。TLS 的 握手 协议 非常 有 效 地 让 客户 和 服务 器 之 间 完 
成 相互 之 间 的 身份 认证 ， 其 主要 过 程 如 下 所 述 。 




















(1) 客户 端的 浏览 器 向 服务 器 传送 客户 端 TLs 协 议 的 版 本 号 ， 加 密 算法 的 种 类 ， 产 生 的 随机 数 ， 以 及 其 他 服务 器 和 客户 端 之 间 通 信 所 需要 的 各 种 信息 。 


(2) 服务 器 向 客户 端 传送 TLS 协 议 的 版 本 号 、 加 密 算法 的 种 类 、 随 机 数 以 及 其 他 相关 信息 ， 同 时 服务 器 还 将 向 客户 端 传送 自己 的 证 书 。 


(3) 客户 利 
名 ”， 服 务 器 证 书 上 的 域名 是 否 和 服务 器 的 实际 域名 相 


(4) 













































































(5) 如 果 服 务 器 要 求 客户 的 身份 认证 (在 握手 过 程 中 为 可 选 ) ， 用 户 可 以 产生 一 个 随机 数 然后 对 其 进行 数据 签名 ， 将 这 个 含有 签名 的 随机 


(6) 如 果 服 务 器 要 求 客户 的 身份 认证 ， 服 务 器 必须 检验 客户 证 书 和 签名 随机 数 的 合法 性 ， 具 体 的 合法 性 验证 过 程 包括 : @ 客 户 的 证 书 使 
的 公 铀 能 否 正确 解 开 客户 证 书 的 发 行 CA 的 数字 签名 ; @@ 检 查 客户 的 证 书 是 否 在 证 书 废止 列表 (CRL) 中 。 检 验 如 果 没有 通过 ， 通 信 立 刻 中 断 ; 如 果 验 证 通过 ， 服 务 器 将 用 





户 端 随机 产生 一 个 用 于 后 面 通信 的 “对 称 密码 ”， 然 后 用 服务 器 的 公 钥 (由 (2) 步骤 获取 ) 对 其 加 密 ， 然 后 将 加 密 后 的 “ 预 主 密码 ” 传 给 服务 器 。 


服务 器 传 过 来 的 信息 验证 服务 器 的 合法 性 ， 服 务 器 的 合法 性 包括 : 证 书 是 否 过 期 ， 发 行 服务 器 证 书 的 CA 是 否 可 靠 ， 发 行者 证 书 的 公 钥 能 否 正确 解 开 服 务 器 证 书 的 “发 行者 的 数字 签 
匹配 等 。 如 果 合法 性 验证 没有 通过 ， 通 信 将 断 开 ; 如 果 合 法 性 验证 通过 ， 将 继续 进行 (4) 。 





数 和 客户 自己 的 证 书 以 及 加 密 过 的 “ 预 























码 ”， 然 后 执行 一 系列 步骤 来 产生 主 通 讯 密码 (客户 端 也 将 通过 同样 的 方法 产生 相同 的 主 通信 密码 ) 。 

















密码 ”一 起 传 给 服务 


日 期 是 否 有 效 ，@ 为 客户 提供 证 书 的 CA 是 否 可 靠 ，@@ 发 行 CA 




















自己 的 私 钥 解 开 加 密 的 “ 预 主 密 


(7) 服务 器 和 客户 端 用 相同 的 主 密码 即 “ 通 话 密码 ” ， 一 个 对 称 密 钥 用 于 TLs 协 议 的 安全 数据 通讯 的 加 解密 通信 。 同 时 在 TLS 通 信 过 程 中 还 要 完成 数据 通信 的 完整 性 ， 防 止 数据 通信 中 的 任何 变化 。 























(8) 客户 端 向 服务 器 端 发 出 消息 ， 指 明 后 面 的 数据 通信 将 使 用 的 〈7) 中 的 主 密码 为 对 称 密 铀 ， 同 时 通知 服务 器 客户 端的 握手 过 程 结束 。 

















(9) 服务 器 向 客户 端 发 出 信息 ， 指 明 后 面 的 数据 通信 将 使 用 的 〈7) 中 的 主 密码 为 对 称 密 钥 ， 同 时 通知 客户 端 服务 器 端的 握手 过 程 结束 。 


到 这 里 ，TLS 的 握手 部 分 结束 了 ，TLS 安 全 通道 的 数据 通信 开始 ， 客 户 和 服务 器 开始 使 





























客户 端 产生 的 密 钥 只 有 客户 端 和 服务 器 端 能 得 到 ; @ 加 密 的 数据 只 有 客户 端 和 服务 器 端 才 能 得 到 明文 ，@ 客 户 端 到 服务 端的 通信 和 是 安全 的 。 


2.HTTPS 和 HTTP 的 区 别 


HTTPS 和 HTTP 有 以 下 区 别 。 





(1) HTTPS 协 议 需 要 到 CA 申请 证 书 ， 一 般 免 费 证 书 很 少 





>， 需 要 交 费 。 





(2) HTTP 是 超 文本 传输 协议 ， 信 息 是 明文 传输 ，HTTPS 则 是 具有 安全 性 的 ss 加 密 传输 协议 。 

















(3) HTTP 和 HTTPS 使 用 的 是 完全 不 同 的 连接 方式 ， 用 的 端口 也 不 一 样 ， 前 者 是 80， 后 者 是 443。 

















(4) HTTP 的 连接 很 简单 ， 是 无 状态 的 ;HTTPS 协 议 是 由 SSL+ HTTP 协 议 构建 的 可 进行 加 密 传输 、 身 份 认证 的 网 络 协议 ， 比 HTTP 协 议 安全 。 





























(5) 目前 ，HTTPS 的 应 用 比 HTTP 的 少 ， 是 因为 HTTPSs 比 较 耗 性 能 ， 对 于 安全 性 没 那么 高 要 求 的 应 用 来 说 ， 用 HTTP 就 已 经 够 了 。 








124 CGI 














CGI (Common Gateway Interface， 通 用 网 关 接 口 ) 是 HTTP 





















































务 器 上 的 CGI 程序 。 它 们 之 间 的 通信 方式 如 图 12-9 所 示 。 
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| 输出 中 的 内 容 返 回 | 
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服务 器 和 客户 端 之 间 的 通信 ， 是 客户 端的 浏览 器 和 服务 器 端的 Web 服 务 器 之 间 的 HTTP 通 信 ， 
标准 输入 输出 来 进行 数据 传递 的 ， 而 这 个 过 程 需要 环境 变量 的 协作 方 可 实现 。 环 境 变量 在 CGI 中 有 着 重要 的 地 位 ， 每 个 CGI 程序 只 能 处 理 一 个 上 











的 环境 变量 。 后 面 会 继续 探讨 环境 变量 ， 这 里 先 不 展开 。 








CG| 是 一 个 标准 化 的 协议 ， 能 够 使 应 用 程序 (通常 称 为 CGI 程序 或 CGI 脚本 ) 同 Web 服 务 器 和 客户 端 进行 交互 。CGI 程 序 能 鲍 有 


C++ 的 相关 实现 。 


1.Apache 安 装 及 启动 











专门 处 理 HTTP 请 求 的 服务 器 ， 也 被 称 为 Web 服 务 器 。 常 








Apache 作 为 Web 服 务 器 ， 并 按照 下 面 5 个 步骤 安装 好 Apache。 


(1) 下 载 : 
lynx http://httpd.apache.org/download.cgi 


(2) 解压 : 





图 12-9 ”客户 端 与 CGI 的 通信 











协议 中 最 重要 的 技术 之 一 ， 有 着 不 可 替代 的 重要 地 位 。CGI 是 一 个 Web 服 务 器 提供 信息 服务 的 标准 接口 。 通 过 CGI 接口 ，Web 服 务 器 就 能 
够 获取 客户 端 提交 的 信息 ， 转 交 给 服务 器 端的 CGI 程序 进行 处 理 ， 最 后 返回 结果 给 客户 端 。 组 成 CGI 通信 系统 的 是 两 部 分 : 一 部 分 是 HTML 页 面 ， 




















就 是 在 用 户 端 浏览 器 上 显示 的 页 面 ， 另 一 部 分 则 是 运行 在 服 
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| 

| 

| 


EK EI 






































Python、PERL、Shell、C 或 C++ 等 语言 来 实现 。 本 书 中 只 讨论 使 








的 Web 服 务 器 有 Apache 和 Nginx， 当 然 几 大 巨头 互联 网 公司 也 都 有 其 独 














研发 的 Web 服 务 器 ， 比 如 阿 旦 


所 以 只 需要 知道 浏览 器 请 求 执行 服务 器 上 哪个 CGI 程序 就 可 以 。 一 般 情况 下 ， 服 务 器 和 CGI 程序 之 间 是 通过 
户 请 求 ， 所 以 在 激活 一 个 CGI 程序 进程 时 也 创建 了 属于 该 进程 









































巴巴 的 Tengine。 本 书 中 使 





gzip-d httpd-2.2.31.tar.gz 
tar xvf httpd-2.2.31.tar 
cd httpd-2.2.31 
(3) 安装 : 
Jconfigure --prefix=/home/sharexu/software/apache-2.2.31/apache-install 
make 
make install 
(4) 将 端口 改 为 8083: 
vi /home/sharexu/software/apache-2.2.31/apache-install/conf/httpd.conf 
Listen 8083 
(5) 启动 Apache: 
键入 “/home/sharexu/software/apache-2.2.31/apache-install/bin/apachectl-k start” 启 动 apache。 


(6) 在 浏览 器 中 输入 “http://42.96.142.129: 8083/” 并 按 Enter 键 ， 若 页 面 显示 “lt works! ” 则 表示 Apache 已 经 安装 并 启动 成 功 ， 如 图 12-10 所 示 。 








[ 42.986.142 120 8083 xXx 


€ +> C A |[|j4296142129:8083 
N 应 用 ”点 二 这 里 导 和 书签。 开始 


It works! 


12-10 在 浏览 器 中 验证 Apache 是 否 安装 成 功 

















2. 第 一 个 CGI 


【 例 12.1】 ”编写 第 一 个 CGI。 





#include <iostream> 
using namespace std; 
int main (){ 
cout << "Content-type:text/html\r\n\r\n"; 
cout << "<html>\n"; 
cout << "<head>\n"; 
cout << "<title>Hello World - First CGI Program</title>\n"; 
cout << "</head>\n"; 
cout << "<body>\n"; 
cout << "<h2>Hello World! This is my first CGI program</h2>\n"; 
cout << "</body>\n"; 
cout << "</html>\n"; 
return 0; 























编译 ， 手 动 执行 一 次 ， 由 于 本 程序 只 是 单纯 输出 一 些 信息 ， 所 以 可 以 直接 执行 ; 之 后 再 将 其 复制 到 Apache 的 cgi-bin 目 录 下 。 执 行 结果 如 图 12-11 所 示 。 


$ gH -0 test test.cpp 
/itest 


<title>Hello World - First CGI Program</title~ 


</head> 
<body> 
<h2>Hello World! This is my first CGI program</h2> 





[sharexuglinux 1201]$ cp test /home/sharexu/software/apache-2.2.31/apache-install/cqi-bin 





图 12-11 412.122 5-89 4,45 265 LE 























在 浏览 器 中 输入 “http://42.96.142.129: 8083/cgi-bin/test" , 提示 “Hello World! This is my first CGI program" ， 则 表示 运行 成 功 了 ， 如 图 12-12 所 示 。 


|€ |o C f D 4296142129:8083/cgi-bin/test 
DIRE) 点 击 这 里 导入 书签 。 开始 


Hello World! This is my first CGI program 








图 12-12 ” 例 12.1 程 序 用 浏览 器 访问 结果 











上 面 的 例 12.1 是 一 个 将 输出 写 入 标准 输出 文件 (stdout) 的 简单 程序 。 这 段 代 码 中 很 重要 的 一 点 那 就 是 第 一 行 代码 : Content-type: text/html\r\n\r\n， 这 行 被 发 送 回 浏览 器 ， 指 明 浏览 器 显示 的 文本 
类 型 。 











3.CGI 环 境 变量 



































对 于 CGI 程序 来 阅 ， 它 继承 了 系统 的 环境 变量 。CGI 环 境 变量 在 CGI 程序 启动 时 初始 化 ， 在 结束 时 销毁 。 当 一 个 CGI 程序 不 是 被 HTTP 服 务 器 调用 时 ， 它 的 环境 变量 几乎 是 系统 环境 变量 的 复制 。 当 这 个 
CGI 程序 被 HTTP 服 务 器 调用 时 ， 它 的 环境 变量 就 会 多 了 以 下 关于 HTTP 服 务 器 、 客 户 端 、CGI 传 输 过 程 等 项 目 。 












































CGI 相关 的 环境 变量 有 3 种 : 与 请 求 相 关 的 环境 变量 、 与 服务 器 相关 的 环境 变量 和 与 客户 端 相关 的 环境 变量 ， 详 细 见 表 12-1。 


表 12-1 CGI 相关 的 环境 变量 及 其 用 途 


REQUEST METHOD 
QUERY STRING 
CONTENT LENGTH 
CONTENT TYPE 
CONTENT FILE 
PATH INFO 
PATH TRANSLATED 
SCRIPT NAME 
HTTP COOKIE 
GATEWAY INTERFACE 
与 服务 器 相关 | SERVER_NAME 
的 环境 变量 SERVER_PORT 
SERVER_SOFTWARE 
REMOTE ADDR 
REMOTE HOST 
ACCEPT 
ACCEPT ENCODING 
ACCEPT LANGUAGE 
AUTORIZATION 
FORM 
IF MODIFIED SINGCE 
PRAGMA 
REFFERER 
USER AGENT 


与 请 求 相 关 的 
环境 变量 


与 客户 端 相 关 
的 环境 变量 


服务 器 与 CGI 程序 之 间 的 信息 传输 方式 

采用 GET 时 所 传输 的 信息 

STDIO 中 的 有 效 信息 长 度 

指示 所 传 来 的 信息 的 MIME 类 型 

使 用 Windows HTTPd/WinCGI 标准 时 ， 用 来 传送 数据 的 文件 名 
路 径 信息 

CGI 程序 的 完整 路 径 名 

所 调用 的 CGI 程序 的 名 字 

用 户 的 Cookie 

服务 器 所 实现 的 CGI 版 本 
服务 器 的 IP 或 名 字 

主机 的 端口 号 

调用 CGI 程序 的 HTTP 服务 器 的 名 称 和 版 本 号 
客户 机 的 主机 名 

客户 机 的 IP 地 址 

列 出 能 被 次 请 求 接收 的 应 答 方式 

列 出 客户 机 支持 的 编码 方式 

表明 客户 机 可 接收 语言 的 ISO 代码 
表明 被 证 实 了 的 用 户 

列 出 客户 机 的 Email 地 址 

当 用 get 方式 请 求 并 且 只 有 当 文 档 比 指定 日 期 更 早 时 才 返 回 数据 
设 定 将 来 要 用 到 的 服务 器 代理 

指出 连接 到 当前 文档 的 文档 的 URL 
客户 端 浏览 器 的 信息 


下 面 来 用 例 12.2 看 下 CGI 的 环境 变量 的 值 都 是 怎么 样 的 。 获 取 环境 变量 需要 用 到 getenv () 函数 ， 它 的 功能 是 从 环境 中 取 字 符 串 ， 获 取 环境 变量 的 值 ， 依 赖 的 头 文件 为 stdlib.h。 


【 例 12.2】 ”获取 CGI 的 环境 变量 。 





#include <iostream> 
#include <stdlib.h> 
using namespace std; 
const string ENV[24] = { 
OMSPEC", "DOCUMENT_ROOT", "GATEWAY INTERFACE", 
"HTTP_ACCEPT", "HTTP ACCEPT ENCODING", 
"HTTP ACCEPT LANGUAGE", "HTTP CONNECTION", 
"HTTP HOST", "HTTP USER AGENT", "PATH", 
"QUERY STRING", "REMOTE ADDR", "REMOTE PORT", 
"REQUEST METHOD" " "REQUEST URI un "SCRIPT FILENAME" " 
"SCRIPT NAME", "SERVER ADDR", "SERVER ADMIN", 
"SERVER NAME VR SERVER PORT" " "SERVER PROTOCOL" " 
"SERVER SIGNATURE","SERVER SOFTWARE"]; 
int main()( 
cout<<"Content-type:text/html\r\n\r\n"; 
cout<<"<html>\n"; 
cout<<"<head>\n"; 
cout<<"<title>CGI Envrionment Variables</title>\n"; 
cout<<"</head>\n"; 
cout<<"<body>\n"; 
cout<<"<table border=\"0\"cellspacing=\"2\">"; 
for (int i=0;i<24;i++){ 
cout<<"<tr><td>"<<ENV [i]««"«/td»«td»" ; 
char *value = getenv(ENV[i].c str()); 
if(value!- 0){ 
cout «« value; 
Jelset 
cout««"Environment variable does not exist."; 


} 
cout<<"</td></tr>\n"; 


} 
cout<<"</table><\n"; 
cout<<"</body>\n"; 
cout<<"</html>\n"; 
return 0; 


} 





程序 编译 后 ， 执 行 结果 如 图 12-13 所 示 。 





[sharexu@linux 1202]$ g++ -0 1202 1202.cpp 
[sharexuglinux 1202]$ ./1202 
Content-type:text/html 


title-cGI Envrionment Variables-/title- 
</head> 
<body> 
«table border-"O"cellspacing-"2"»«tr»- KETTES variable does not exist.< 
«td-DOCUMENT ROOT«/td-«td-Environment variable does not exis 
td-GATEWAY INTERFACEc/td--td»-Environment variable does not exis 
«td-HITP ACCEPT-/td-——td-Environnent variable does not exist.«/td 
«trzxtd-HTTP ACCEPT ENCODING«/td-«td-Environment variable does not exist 
-etr--td-HTTP ACCEPT LANGUAGE-/td»-td-Environment variable does not exist 
«tr»«td-HTTP. CONNECTION«/td»-td»Environment variable does not 
<tr><td>HTTP HOST«/td-«td»-Environment variable does not exist.-/t 
«tr-td-HITP USER AGENT«/td»-—td-Environment variable does not exist.« 
ztr2ztd»PATHc/1d-td-»/usr/lacal/bin:/bin:/usr/bin:/usr/local/sbin:/usr/ 'sbin: rsbin:/alidata/serl 
<tr><td~QUERY STRING-/td--td-Environment variable does not exist. 
d-REMOTE ADDR«/ ctd»Environment variable diu not exist 
-REMOTE PORT«/td-—td»Environnent variable does nct exist.«/t 
- «td»-REQUEST | METHOD«/td-td»-Environment variable does not exist 
><td>REQUEST URI</ td»Environnent variable does not exist.< 
-td-SCRIPT FILENAME«/td--td-Environment variable does not exist 
«td SCRIPT | NAME / d»Environnent variable does not exist : 
«trtd: -SERVER ADDR«/ t Environnent variable dces not d 
«tr»«td»SERVER ADMINc/td»-td-Environment variable does not exist.- 
tr»td-SERVER NAME«/td---td»Environnent variable does not exist.-/t 
tr><td> -SERVER | PORT</td><td>Environment variable does not exist,</t 
«td» SERVER. PROTOCOL- —td-Environment variable does not exist. 
td-SERVER SIGNATURE --td»Environment variable does nct exist 
“td>SERVER SOFTWARE«/td»-td-Environment variable does not exist. 


Esa nos ione 12021$ cp 1202 /heme/sharexu/softw 
[sharexuglinux 1202]$ 











图 12-13” 例 12.2 程 序 执行 结果 














可 以 发 现 很 多 环境 变量 都 是 空 的 ， 但 是 把 它 当 成 CG| 来 执行 后 ， 各 个 环境 变量 里 都 有 了 值 ， 如 图 12-14 所 示 。 











附加 到 URL 的 末 


白 CGI Envrionment Variab x 





€ > CŒ fi |4296.142.129:8083/cgi-bin/1202 





CONSPEC Envircrment variable does nct exist. 
DOCUMENT_ROOT /bome/sharexu/software/apache-2. 2. 3l /apache-install/htdocs 


GATEWAY_INTERFACE CGBIA.1 


HTTP_ACCEPT text/html, applicari on/xhtml*xnl, application/xml ;a=0. 9, image/webp, */*; q=0. 8 


HTTP ACCEPT ENCODING gzip, deflate, sdch 
HTTP ACCEPT LANGUAGE zh-CN, zh; q=0. 8 
HTTP. CONNECTION keep-alive 
HTTP_HOST 42. 96. 142. 129 : 8083 


HTTP_USER_AGENT Mozilla/5.0 (Windows NT 6.1; WOUW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46. 0. 2490. 86 Safari/537. 36 


PATH /usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/alidata/server/mysql/bin:/alidata/server/nginx/sH 
bin:/alidata/tools/ffmocg:/homc/shareru/bin 


QUERY STRING 

REMOTE_ADDR 116. 24. 140. 208 
RENOTE_PORT 50586 
REQUEST_METHOD GET 

REGUEST RI /cgi-bin/1202 


SCRIPT_FILENAME Zhame/sharexu/software/apache-2. 2. 31 /apache-install/cgi-bin/1202 


SCRIPT NAME /cgi-bin/1202 

SERVER ADDR 42. 96. 142. 129 
SERVER. ADMIN youflexenple. com 
SERVER, NAME 42. 96. 142. 129 
SERVER. PORT 8083 

SERVER, PROTOCOL. HITP/1.1 
SERVER_SIGNATURE 

SERVER_SOFTWARE &pache/2.2.31 (Unix) 

















12-14 例 12.3 的 CGI 在 浏览 器 执行 结果 图 








如 果 再 去 把 CGI 程序 手动 执行 一 次 ， 会 发 现 结果 还 是 和 第 一 次 手动 执行 该 CGI 程序 的 结果 一 样 ， 这 也 验证 了 CGI 是 一 个 进程 ， 且 在 处 理 完 一 个 请 求 后 就 退出 ， 在 下 一 个 请 求 到 来 时 再 创建 一 个 新 进程 。 


Qa 


REQUEST_METHOD 的 值 一 般 包 括 POST 和 GET 两 种 。 


4.GET 参 数 的 获取 





在 GET 方 法 下 ，CGI 程 序 无 法 直接 从 服务 器 的 标准 输入 中 获取 数据 ， 因 为 服务 器 把 它 从 标准 输入 接收 到 的 数据 编码 到 环境 变量 QUERY_STRING (或 PATH_INFO) 。 采 用 
尾 ， 如 http://42.96.142.129: 8083/cgi-bin/1203? a=1&b=2&c=3， 这 时 候 QUERY_STRING 的 值 为 a=1&b=2&c=3。 


























【 例 12.3】 ”获取 GET 方 法 中 的 参数 。 





GET 方 法 时 ， 只 需 将 把 这 些 数据 





#include<iostream> 
#include<stdlib.h> 
#include<vector> 
#include<string> 
using namespace std; 
vector<string> StringSplit(const string& sData, const string& sDelim)( 
vector«string»vItems; 
vItems.clear(); 
string::size type bpos - 0; 
string::size type epos - 0; 
string::size type nlen - sDelim.size(); 
while ((epos-sData.find(sDelim, epos)) != string::npos)( 
vItems.push back(sData.substr(bpos, epos-bpos)); 
epos += nlen; 
bpos = epos; 





vItems.push back(sData.substr(bpos, sData.size()-bpos)); 
return vItems; 


int main()( 
cout << "Content-type:text/html\r\n\r\n"; 
cout << "<html>\n"; 
cout << "<head>\n"; 
cout << "<title>Hello World - First CGI Program</title>\n"; 
cout << "</head>\n"; 
cout << "<body>\n"; 
Cout<<"get parameter:<br/>"; 
char *value = getenv ("QUERY_STRING") ; 
if(value!- 0){ 
/*"a-1&b-2&c-3"*/ 
vector«string?paras-StringSplit ((const string)value,"&"); 
vector«string»::iterator iter-paras.begin(); 
for(;iter!-paras.end();iter-)( 
vector«string^singlepara-StringSplit (*iter, "-"); 
cout««singlepara[0]««" "««singlepara[1]««"«br/»"; 
} 
cout << "</body>\n"; 
cout << "</html>\n"; 
return 0; 








编译 并 复制 到 cgi-bin 目 录 下 ， 效 果 如 图 12-15 所 示 。 











/software/a 


all/cgi-bin 





图 12-15 ”编译 例 12.3 的 程序 和 复制 到 cgi-bin 目 录 下 终端 效果 图 


在 浏览 器 中 输入 “http://42.96.142.129: 8083/cgi-bin/1203? a=1&b=2&c=3”， 按 Enter 键 ， 即 可 得 到 如 图 12-16 所 示 的 结果 。 





[5 Hello World - First CGI F x 


€ > C fi [|)4296.142.129:8083/cgi-bin/1203?a- 18b -2&c-3 
IU 应 用 ”点击 这 里 导入 书签 。 开始 





get parameter: 
al 
b2 
c3 











W 


12-16 在 浏览 器 中 执行 例 12.3 CGI 结果 图 



































例 12.3 中 ， 用 了 一 个 函数 专门 来 分 隔 字 符 串 的 。sData 是 源 字 符 串 ，sDelim 是 分 隔 符 ， 返 回 值 是 分 隔 好 的 字符 串 列表 ， 代 码 如 下 : 








Vector<string> StringSplit(const string& sData, const string& sDelim)( 
vector«string»vItems; 
vItems.clear(); 

size type bpos 

size type epos 

string::size type nlen - sDelim.size(); 

while ( (epos=sData. find (sDelim, epos)) != string: :npos)1{ 
vItems.push back(sData.substr(bpos, epos-bpos)); 
epos += nlen; 
bpos = epos; 






} 
vItems.push back(sData.substr(bpos, sData.size()-bpos)); 
return vItems; 








这 里 是 获取 GET 参 数 的 代码 ， 先 根据 “&” 符 分 隔 ， 然 后 再 根据 “=” 符 进行 二 次 分 隔 ， 即 可 得 到 参数 的 内 容 ， 代 码 如 下 : 








vector«string»paras-StringSplit ((const string)value,"&"); 

vector€string»::iterator iter-paras.begin(); 

for (;iter!=paras.end () ;iter++) { 
vector<string>singlepara=StringSplit (*iter, "="); 
cout<<singlepara[0]<<" "««singlepara[1]««"«br/»"; 





5.POST 参 数 的 获取 








在 POST 方法 下 ，CGI 程 序 可 以 直接 从 服务 器 的 标准 输入 中 获取 数据 ， 不 过 要 先 从 CONTENT_LENGTH 这 个 环境 变量 中 得 到 POST 参数 的 长 度 ， 然 后 再 读 取 相应 长 度 的 内 容 。 








【 例 12.4】 ”获取 POST 参数 的 内 容 。 


post.html 的 代码 如 下 : 





<html> 

<head> 

<title>CGI Post</title> 

</head> 

<body> 

<tr><td> 

<div>Method: POST</div> 

<div>lease input two number:<div> 
<form method="post" action-"./cgi-bin/post"» 
<input type-"txt" siz 3" name-"m"»* 
«input type-"txt" sizi 3" name-"n"»- 
«input type="submit" value-"result"» 
«/form» 

«/td»«/tr» 

</table> 

</body> 

</html> 








post.cpp 的 代码 如 下 : 





#include<iostream> 
#include<stdlib.h> 
#include<stdio.h> 
using namespace std; 
int main (){ 
cout << "Content-type:text/html\r\n\r\n"; 
cout << "<html>\n"; 
cout << "<head>\n"; 
cout << "<title>Testing Post</title>\n"; 
cout << "</head>\n"; 
cout << "<body>\n"; 
char *lenstr =getenv ("CONTENT_LENGTH") ; 
if (lenstr==NULL) { 
cout<<"Error, CONTENT_LENGTH should be entered!"<<"<br/>"; 
Jelse( 
int len-atoi (lenstr); 
char poststr[20]; 
fgets (poststr, len+1, stdin) ; 
cout<<"poststr:"<<poststr<<"<br/>"; 
char m[10],n[10]; 
if (sscanf (poststr, "m-$[^&]&n-$s",m,n) !-2) ( 
cout««"Error: Parameters are not right!«br/»"; 
} 
else{ 
cout««"m * n = "««atoi (m) *atoi (n) ««"«br/»"; 
} 


} 

cout << "</body>\n"; 
cout << "</html>\n"; 
return 0; 




















将 post.cpp 编 译 后 放 到 cgi-bin 目 录 下 ， 把 post.htm| 复 制 到 htdocs 目 录 下 ， 效 果 如 图 12-17 所 示 。 

















(sharexu@linux 1204]$ vim post.cpp 


[sharexuglinux 1204]$ g++ -0 post 


[sharexuglinux ]$ cp post ../../s re/apache-2.2 
bm 


cp post.htnl ../../software/apache-2.2.3 /h s/ 








图 12-17 编译 例 12.4 程 序 和 复制 到 cgi-bin 目 录 的 终端 效果 














在 浏览 器 中 输入 “http://42.96.142.129: 8083/post.html”， 并 按 Enter 键 ， 得 到 如 图 12-18 所 示 的 内 容 。 

















分 别 在 两 个 输入 框 中 填 入 “3” 和 “4”， 单 击 result 按 钮 ， 会 输出 如 图 12-19 所 示 的 结果 。 











Method: POST 
lease input two nunber: 


|€ > C fi |D 4236142.129:8083/cgi-bin/post 


poststr:mn-S&n-4d 
m^ n= 12 








图 12-19  JTpostiX 4-CGI 8] P ÈE 




















例 12.4 中 ， 先 用 getenv 获 得 环境 变量 CONTENT_LENGTH 的 值 ， 也 就 是 有 效 信息 的 长 度 ， 代 码 如 下 : 














char *lenstr —-getenv ("CONTENT LENGTH"); 











然后 用 fgets 函 数 从 标准 输入 stdin 中 获得 len+ 1 长 度 的 内 容 ， 代 码 如 下 : 





fgets (poststr, len+1, stdin) ; 














再 利用 sscanf 浮 数 获取 m、n 变 量 的 值 ， 代 码 如 下 : 








sscanf (poststr, "m=%[^&] &n=%s",m,n) 





对 比例 12.3 和 例 12.4， 可 以 看 到 获得 GET 方 法 的 参数 和 POST 方法 的 参数 的 差异 。 








其 实 ， 例 12.4 的 程序 不 够 健壮 ， 比 如 在 读 取 POST 参 数 内 容 ， 获 取 特 定 长 度 的 字符 串 内 容 时 ， 应 当 考 虑 读 取 中 断 的 情况 ， 原 始 代码 如 下 : 


int len-atoi (lenstr); 
char poststr[20]; 
fgets (poststr, len+1, stdin) ; 








这 几 行 程序 ， 可 以 改 成 下 面 这 样 : 





string sPostData; 

int len-atoll (lenstr); 
if (len==0) return 0; 
if(len»0)( 


sPostData.resize (len); 


int bytes-0; 
while (bytes«len)( 


int n-read(0, (char*)sPostData.data()*bytes, len-bytes); 


if(n«0) { 


if(errno--EINTR) continue; 


return -1; 
Jif(n--0) { 
return -1; 
Jelse( 
bytes += n; 
} 






























































首先 ， 参 数 的 内 容 可 能 比较 长 ， 用 atoll 转 换 为 长 整 型 肯定 比 atoi 转 换 为 整 型 要 靠 谱 些 ; 其 次 ，《UNIX 环 境 高 级 编程 》 中 指出 ， 每 次 调用 fgets 函 数 会 造成 标准 输出 设备 自动 刷新 ， 这 里 改 用 read 函 数 ， 


根据 Linux 上 一 切 皆 文件 的 说 法 ， 上 
































6.Cookie 














在 程序 中 ， 会 话 跟 踪 是 很 























何 商品 都 应 该 放 在 A 的 购物 车 内 








read 会 显得 更 易 理解 。 而 且 ， 进 行 读 操作 的 时 候 ， 遇 到 中 断后 ， 还 可 以 继续 读 。 


























的 事情 。 理 论 上 ， 一 个 用 户 的 所 有 请 求 操作 都 应 该 属于 同一 个 会 话 ， 而 另 一 个 用 户 的 所 有 请 求 操作 则 应 该 属于 另 一 个 会 话 ， 两 者 不 能 混淆 。 例 如 ， 用 户 A 在 超市 购买 的 任 


















































， 不 论 是 用 户 A 什 么 时 间 购 买 的 ， 这 都 是 属于 同一 个 会 话 的 ， 而 不 能 放 入 用 户 B 或 用 户 C 的 购物 车 内 ， 这 不 属于 同一 个 会 话 。 





















































而 Web 应 用 程序 是 使 用 HTTP 协 议 传输 数据 的 。HTTP 协 议 是 无 状态 的 协议 。 一 旦 数据 交换 完毕 ， 客 户 端 与 服务 器 端的 连接 就 会 关闭 ， 再 次 交换 数据 需要 建立 新 的 连接 ， 这 就 意味 着 服务 器 无 法 从 连接 上 
























































跟踪 会 话 。 即 用 户 A 购 买 了 一 件 商品 并 放 入 购物 车 内 ， 当 再 次 购买 商品 时 服务 器 已 经 无 法 判断 该 购买 行为 是 属于 用 户 A 的 会 话 还 是 用 户 B 的 会 话 了 。 要 跟踪 该 会 话 ， 必 须 引 入 一 种 机 制 。Cookie 就 是 这 样 的 一 
种 机 制 ， 它 弥补 了 HTTP 协 议 无 状态 的 不 足 。 





Cookie 实 际 上 是 一 小 段 的 文本 信息 。 



































客户 端 请 求 服务 器 ， 如 果 服 务 器 需要 记录 该 用 户 状态 ， 就 使 用 response 向 客户 端 浏 览 器 颁发 一 个 Cookie。 客 户 端 浏 览 器 会 把 Cookie 保 存 起 来 。 当 浏览 器 再 请 求 该 











网 站 时 ， 浏 览 器 把 请 求 的 网 址 连同 该 Cookie 一 同 提交 给 服务 器 ， 服 务 器 检查 该 Cookie， 以 此 来 辨认 用 户 状态 。 服 务 器 还 可 以 根据 需要 修改 Cookie 的 内 容 。 








很 多 网 站 都 会 使 用 Cookie， 例 | 



































0Google 会 向 客户 端 颁 发 Cookie，Baidu 也 会 向 客户 端 颁发 Cookie。 那 浏览 器 访问 Google 会 不 会 也 携带 上 Baidu 颁 发 的 Cookie 呢 ? 或 者 Google 能 不 能 修改 Baidu 颁 发 的 


Cookie 呢 ?答案 是 否定 的 。Cookie 具 有 不 可 跨 域名 性 。 根 据 Cookie 规 范 ， 浏 览 器 访问 Google 只 会 携带 Google 的 Cookie， 而 不 会 携带 Baidu 的 Cookie; Google 也 只 能 操作 Google 的 Cookie， 而 不 能 操作 








Baidu 的 Cookie。Cookie 在 客户 端 是 由 浏览 器 来 管理 的 ， 从 而 保证 用 户 的 隐私 安全 。 浏 览 器 会 判断 一 个 网 站 是 否 能 操作 另 一 个 网 站 Cookie 的 依据 是 域名 ， 例 如 ，Google 与 Baidu 的 域名 不 一 样 ， 因 此 























Google 不 能 操作 Baidu 的 Cookie。 需 要 注意 的 是 ， 虽 然 网 站 images.google.com 与 网 站 www.google.com 同 属于 Google， 但 是 域名 不 一 样 ， 两 者 同样 不 能 互相 操作 彼此 的 Cookie。 


从 表 12-1 可 以 看 到 ，Cookie 也 在 环 : 


const char* cookie=getenv ("HTTP COOKIE"); 

















HarErh, AARE RRS Cookie: 








如 果 用 户 是 在 自己 家 的 计算 机 上 上 网 ， 登 录 时 就 可 以 记 住 个 人 的 登录 信息 ， 下 次 访问 时 不 需要 再 次 登录 ， 直 接 访问 即 可 。 实 现 方法 是 把 登录 信息 如 账号 、 密 码 等 保存 在 Cookie 中 ， 并 控制 Cookie 的 有 效 








期 ， 下 次 访问 时 再 验证 Cookie 中 的 登录 信息 和 
危险 的 选择 ， 一 般 不 把 密码 等 









































可 。 保 存 登录 信息 有 多 种 方案 。 最 直接 的 是 把 用 户 名 与 密码 都 保持 到 Cookie 中 ， 下 次 访问 时 检查 Cookie 中 的 用 户 名 与 密码 ， 并 与 数据 库 比 较 。 这 是 一 种 比较 
要 信息 保存 到 Cookie 中 。 还 有 一 种 方案 是 把 密码 加 密 后 保存 到 Cookie 中 ， 下 次 访问 时 解密 并 与 数据 库 比较 。 这 种 方案 略微 安全 一 些 。 如 果 不 希 望 保存 密码 ， 还 可 以 把 登录 的 






































7. 获 取 用 户 的 IP 地 址 











后 ， 连 同 账号 一 块 保存 到 Cookie 中 。 下 次 访问 























时 间 戳 保存 到 Cookie 与 数据 库 中 ， 到 时 只 验证 用 户 名 与 登录 时 间 戳 就 可 以 了 。 也 可 以 这 样 ， 只 在 登录 时 查询 一 次 数据 库 ， 以 后 访问 验证 登录 信息 时 不 再 查询 数据 库 。 实 现 方式 是 把 账号 按照 一 定 的 规则 加 密 





















































时 只 需要 判断 账号 的 加 密 规则 是 否 正确 即 可 。 最 后 一 种 方案 ， 也 是 现在 各 大 网 站 的 常用 做 法 。 


有 时 候 定 位 问题 时 ， 需 要 知道 用 户 的 IP 地 址 ， 获 取 用 户 IP 地 址 有 两 个 环境 变量 : HTTP_VIA 和 REMOTE_ADDR。 当 用 户 使 用 代理 服务 器 访问 时 ，HTTP_QVIA 环 境 变量 的 值 不 为 空 ， 用 户 的 |P 也 就 是 代理 














服务 器 的 IP 了 。 用 户 没 有 用 代理 服务 器 访问 时 ， 则 1P 地 # 




















std::string GetClientIP()( 
const char* p = getenv ("HTTP QVIA"); // proxy 


if (p&&strlen(p)»-8) 
char buf[32]; 





1 


snprintf(buf, sizeof(buf), "$d.$d.$d.$d", 


(uint8 t)hexToChar (p[0],p[ 
(uint8 t)hexToChar( (b[2]] pi 
(uint8 | t)hexToChar ( (p[41, pL 
(uint8 | t)hexToChar( (p[6],p[ 


return std: :String (buf); 


} 


else{ 


p = getenv ("REMOTE_ADDR") ; // no proxy 


if (p) return p; 


return "0.0.0.0"; 


12.5 FastCGl 

















目 就 在 REMOTE_ADDR 环 境 变量 中 了 。 下 面 这 个 函数 可 以 获得 用 户 的 |P 地 址 。 


























CGI 工作 原理 : 每 当 客 户 请 求 CGI 的 时 候 ，Web 服 务 器 就 请 求 操作 系统 生成 一 个 新 的 CGI 进程 ， 该 进程 处 理 完 请 求 后 退出 ， 下 一 个 请 求 来 时 再 创建 新 进程 。 当 然 ， 这 样 在 访问 量 很 少 没有 并 发 的 情况 可 


行 ， 可 是 当 访问 量 增 大 且 并 发 存在 时 ， 这 种 方式 就 不 适合 




















了 ， 于 是 就 有 了 FastCG|。 





FastCGI 像 是 一 个 常 驻 (long-live) 型 的 CG1， 它 可 以 一 直 执 行 着 ， 只 





一 般 情况 下 ，FastCGI 的 整个 工作 流程 如 下 所 述 。 


激活 后 ， 不 会 每 次 都 要 花费 时 间 去 fork 一 次 (这 是 CGI 最 为 人 诉 病 的 fork-and-execute 模 式 ) 。 


(1) Web Server 启 动 时 载 入 FastCG|I 进 程 管理 器 (IIS 1SAPI 或 Apache Module) 。 





(2) FastCGI 进 程 管理 器 

















身 初 始 化 ， 启 动 多 个 CGI 进程 并 等 待 来 自 Web 服 务 器 的 连接 。 





(3) 当 客 户 端 请 求 到 达 Web server 时 ，FastCGI 进 程 管理 器 选择 并 连接 到 一 个 FastCGI 进 程 。Web 服 务 器 将 CGI 环境 变量 和 标准 输入 发 送 到 FastCGI 进 程 。 





(4) FastCGI 子 进程 完成 处 理 后 将 标准 输出 和 错误 信息 从 同一 连接 返 
(运行 在 Web 服 务 器 中 ) 的 下 一 个 连接 。 





E] 











Web Server。 当 FastCGI 子 进程 关闭 连接 时 ， 请 求 便 被 告知 处 理 完成 。FastCGI 进 程 接着 等 待 并 处 理 来 自 FastCGI 进 程 管 理 器 

















对 FastCGI 有 兴趣 的 读者 可 以 去 网 上 搜索 更 详细 的 资料 。 


12.6 本章 小 结 


本 章 主 要 介绍 了 HTTP 协 议 及 其 应 用 CGI 的 环境 变量 、GET 方 法 的 使 用 、POST 方 法 的 使 用 、Cookie 的 使 用 和 用 户 IP 地 址 的 获取 等 。 接 下 来 的 第 13 章 ， 将 会 介绍 下 后 台 开 发 中 常用 的 类 库 。 


第 13 章 ”常用 类 库 


我 们 在 编写 程序 的 过 程 中 经 常会 遇 到 代码 重复 的 情况 ， 可 以 在 重复 时 选择 复制 粘贴 ， 或 者 构建 一 个 函数 来 实现 复 用。 但 是 这 样 并 不 是 最 好 的 解决 办 法 ， 因 为 出 现 这 种 情况 是 由 于 一 开始 就 不 完全 清楚 这 
个 过 程 是 怎么 样 的 ， 对 功能 也 没有 进行 深入 分 析 。 在 开发 之 前 ， 只 是 了 解 了 大 概 需 求 ， 然 后 就 开始 编程 ， 在 开发 过 程 当中 东 拼 西 次 ， 虽 然 仍然 能 够 把 功能 完成 ， 但 是 对 整个 程序 并 不 能 了 然 于 胸 ， 出 现 问题 
就 一 句 一 句 地 查找 问题 ， 显 然 这 是 很 浪费 时 间 的 。 


如 何 来 解决 这 个 问题 ， 答 案 就 是 类 化 。 在 编写 代码 之 前 ， 先 将 整个 系统 的 功能 做 个 整体 的 认识 ， 然 后 对 过 程 功能 进行 抽象 ， 在 抽象 的 过 程 当 中 就 需要 对 各 个 功能 的 各 个 细节 进行 考虑 ， 将 功能 相关 的 函 
数 最 简化 。 由 于 在 编写 代码 之 前 就 已 经 对 细节 进行 了 考查 ， 所 以 在 编写 过 程 中 就 不 会 出 现 重复 代码 的 情况 ， 当 然 也 有 一 个 粒度 问题 ， 比 如 在 某 个 参数 有 两 个 输入 ， 产 生 4 种 可 能 ， 而 每 一 种 可 能 当中 有 些 细节 
是 相同 的 ， 那 么 到 底 应 不 应 该 将 这 些 细节 提取 出 来 进行 复 用 ， 这 就 是 粒度 问题 ， 粒 度 问 题 应 该 结合 实际 和 自身 的 情况 来 做 决定 。 接 着 就 可 以 将 这 个 功能 类 化 ， 荔 能 类 化 的 优点 不 仅仅 可 以 实现 类 的 复 用 〔〈 因 
为 在 设计 之 前 每 个 细节 都 已 经 考虑 到 ) ， 更 关键 的 地 方 在 于 使 用 这 个 类 的 开发 人 员 不 需要 知道 内 部 具体 的 实现 是 怎么 样 的 ， 这 就 是 笔者 认为 要 实现 类 应 该 达到 的 目标 。 


构建 一 个 类 库 ， 首 先 需要 提取 功能 、 抽 和 象 功能 ， 然 后 设计 私有 数据 、 公 共 数 据 以 及 方法 ， 完 成 了 这 些 工 作 之 后 ， 一 个 类 库 就 完成 了 。 之 后 把 头 文件 、 实 现 拿 出 来 ， 放 在 程序 中 ， 完 成 复 用 。 当 然 底 层 系 
统 不 同 具 体 的 函数 是 需要 重新 实现 的 ， 但 上 层 代码 完全 不 需要 更 改 。 





要 使 用 第 三 方 源码 库 ， 第 一 步 少不了 的 就 是 编译 ， 将 源码 文件 编译 成 方便 使 用 的 动态 链接 库 、 静 态 链接 库 或 者 静态 导入 库 。 
使 用 第 三 方 源码 最 简单 的 方法 是 直接 将 文件 加 入 工程 ， 但 这 样 不 利于 软件 、 源 码 产 品 的 管理 ， 对 于 一 般 软 件 开 发 来 说 ， 不 建议 使 用 。 


C++ 已 经 有 这 么 多 年 的 历史 了 ， 很 多 类 库 都 已 经 很 完善 了 ， 本 章 将 介绍 几 个 常用 的 类 库 。 


13.1 JSON 





























前 面 第 12 章 讲 到 ，web 页 面 通常 使 用 CGI 来 与 后 端 交互 。 假 设 有 这 样 的 场景 ， 页 面 需要 展示 当前 用 户 的 数据 ， 比 如 年 龄 age， 这 时 候 CGI 应 该 怎么 样 返 回 数据 ?实际 上 ， 页 面 拿 到 CGI 返回 的 数据 后 ， 需 
要 逐个 解析 每 个 字段 的 值 ， 再 将 其 展示 到 页 面 上 。 当 用 户 的 数据 有 多 个 ， 比 如 职业 (occupation) 和 性 别 (sex) ， 那 就 得 是 age=30&occupation=engineer&sex=female， 如 果 有 两 个 用 户 ， 则 更 加 复 
杂 : age=30&occupation=engineer&sex=female&age=31&occupation=engineer&sex=male， 可 以 看 到 数据 解析 麻烦 ， 也 不 好 扩展 。 这 时 候 JSON 就 可 以 派 上 用 场 了 ， 一 个 用 户 的 数据 可 以 表示 
73: l'age": 30}， 乍 一 看 ， 好 像 没 什么 优势 ， 甚 至 比 age=30 更 占 空间 ， 但 是 当 多 个 key-value 串 在 一 起 时 ，JSON 就 能 体现 它 的 价值 了 。 比 如 一 个 用 户 的 多 维 数据 可 以 这 样 表示 : 


































































































"age":30, 
"occupation" :"engineer", 
"sex" ;"female" 




















两 个 用 户 的 多 维 数据 可 以 这 样 表示 : 











"age":30, 
"occupation":"engineer", 
"sex":"female" 


"age":31, 
"occupation":"engineer", 
"sex":"male" 














是 不 是 很 清晰 明了 ， 而 且 ，JSON 还 有 专门 的 API， 帮 助 开发 者 解析 出 各 个 字段 的 值 。 下 面具 体 来 看 下 JSON 究 竟 是 什么 。 














1JSON 是 什么 

















JSON (JavaScript Object Notation，Javascript 对 象 表示 法 ) 是 一 种 轻 量 级 的 数据 交换 格式 ， 易 于 人 阅读 和 编写 ， 同 时 也 易于 机 器 解析 和 生成 。JSON 是 存储 和 交换 文本 信息 的 语法 ， 采 用 完全 独立 于 
语言 的 文本 格式 ， 但 是 也 使 用 了 类 似 于 C 语 言 家 族 的 习惯 (包括 C、C++、C#、Java、JavaScript、Perl、Python 等 ) 。 这 些 特性 使 /SON 成 为 理想 的 数据 交换 语言 。 



































JSON 构 建 于 两 种 结构 ， 如 下 所 述 。 


(1) key-value 对 的 集合 。 不 同 的 语言 中 ， 它 被 分 别 理解 为 对 象 (object) 、 纪 录 (record) 、 结 构 (struct) 、 字 典 (dictionary) 、 哈 希 表 (hash table) 、 有 键 列 表 (keyed list) 或 者 关联 数组 
(associative array) 。 





(2) 值 的 有 序列 表 。 在 大 多 数 语言 中 ， 它 被 理解 为 数组 (array). RÆ (vector) 、 列 表 (list) 或 者 是 序列 (sequence) 。 











JSON 对 象 是 一 个 无 序 的 key-value 集 合 。 一 个 JSON 对 象 以 “{” ( 左 括号 ) 7H, "Y GES) 结束 。 每 个 Key 后跟 一 个 “: ” (冒号 ) ; key-value 之 间 使 用 “，” (逗号 ) 分 隔 。 














数组 是 值 (value) 的 有 序 集合 。 一 个 数组 以 “[” (EPES) 开始 ，“]” (EFES) 结束 。 值 之 间 使 








"," (逗号 ) 分 隔 。 


值 (value) 可 以 是 双 引 号 括 起 来 的 字符 串 (string) 、 数 值 (number) 、true、false、null、 对 象 (object) 或 者 数组 (array) ， 并 且 这 些 结构 可 以 嵌 套 。 























字符 串 (string) 是 由 0 到 多 个 unicode 字 符 组 成 的 序列 ， 封 装 在 双 引 号 (“”) 中 ， 可 以 使 用 反 斜 杠 (V) 来 进行 转 义 。 一 个 字符 可 以 表示 为 一 个 单一 字符 的 字符 串 。 











数字 (number) 类 似 C 或 者 Java 里 面 的 数 ， 没 有 用 到 的 8 进 制 和 16 进 制 数 除外 。 











2.JsonCpp 的 使 


























JsonCpp 是 C++ 中 比较 稳定 的 处 理 JSON 的 库 ， 要 使 用 这 类 第 三 方 源码 库 ， 第 一 步 少 不 了 的 就 是 编译 ， 将 源码 文件 编译 成 方便 使 用 的 动态 链接 库 、 静 态 链 接 库 或 者 静态 导入 库 。JsconCpp 进 行 JSON 解 
析 的 源码 文件 分 布 在 include/json、src/lib json 下 。 其 实 JsonCpp 源 码 并 不 多 ， 为 了 方便 产品 管理 ， 此 处 没 必 要 将 其 编译 为 动态 链接 库 或 者 静态 导入 库 ， 所 以 笔者 选择 使 用 静态 链接 库 。 






























































这 里 编译 JsonCpp 的 静态 库 需要 用 到 一 个 工具 scons， 先 用 已 root 的 用 户 权限 执行 yum install scons 命 令 来 安装 scons， 等 到 提示 “Complete! ”就 是 安装 成 功 了 。 解 压 JsonCpp 的 压缩 包 ， 进 入 解压 
目录 后 ,执行 “scons platform=linux-gcc” 命 令 ， 它 会 自行 编译 ， 编 译 出 来 的 库 文件 在 其 libs/linux-gcc-4.4.6 目 录 下 ， 有 libjson _linux-gcc-4.4.6_libmt.so 和 libjson_linux-gcc-4.4.6_libmt.a; 头 文件 在 
解压 目录 下 的 include 中 。 再 把 libjson_linux-gcc-4.4.6 libmt.a 和 头 文件 复制 到 所 要 编码 的 目录 中 ， 这 时 候 就 可 以 开始 编写 测试 程序 了 。 









































【 例 13.1】 JsonCpp 的 使 用 范例 。 











test.cpp 的 代码 是 : 


#include <iostream> 
#include <string> 
#include "json/json.h" 
using namespace std; 
int main (){ 

Json::Value json_temp; 


json temp["name"] = Json: :Value ("sharexu"); 

json temp["age"] = Json: :Value (18); 

Json: :Value root; 

root ["key : string"] = Json::Value("value string"); 
root ["key 1 number"] = Json::Value(12345); 
root["key boolean" l = Json: :Value (false); 

root ["key « ' double"] = Json::Value (12.345); 

root ["key « object"] = json temp; 

root["key array"].append("array string"); 
root["key array"].append(1234); 


Json::FastWriter fast writer; 
std::cout << fast writer.write (root); 
Json::StyledWriter styled writer; 
std: :cout «« styled writer.write (root); 
string str test ="{\"id\":1, V"name V" : V'pacozhong V)"; 
Json::Reader reader; 
Json::Value value; 
if (!reader.parse(str test, value)) 
return 0; 
string value name-value ["name"].asString(); 
cout ««value name««endl; 
cout ««value ["name"]; 
if(!value["id"].isInt())( 
cout««"id is not int"««endl; 
Jelse( 
int value id-value["id"].asInt(); 
cout««value id««endl; 
} 


return 0; 


makefile 的 代码 是 : 


test:test.o 

gt -o test test.o -I./include -L./lib -1json linux-gcc-4.4.6 libmt 
test.o:test.cpp 

g++ -c test.cpp -I./include -L./lib -1json linux-gcc-4.4.6 libmt 





执行 make 命 令 ， 即 可 编译 成 功 。 执 行 ./test 命 令 ， 程 序 的 执行 结果 如 图 13-1 所 示 。 











[sharexuglinux 1301]$ ./test 


UÜkey array":[* array. string" 
"name" : "sharexu" 


4],"key boolean":false,"key double":12.3450, "key number":12345,"key objec 
,"key string":"value string") 


BrE 
} 
"key_array" : [ "array_string", 
"key_boolean" : TS 
"key_doub 

"key. 


"key string" : "value string" 


pacozhong 
"pacozhong" 


[sharexuglinux 13011$ 





E33 4513.8 49 UTE 





注意 ， 当 前 的 目录 树 应 该 如 图 13-2 所 示 。 











[sharexu@linux 1301]$ tree 

include 

L— json 
autolink.h 
config.h 
features.h 
forwards.h 
json. h 
reader. h 
value.h 
writer.h 

lib 

L— libjson linux-gcc-4.4.6 libmt.a 

makefile 

test 

test.cpp 

test.o 


3 directories, 13 files 
[sharexuglinux 130115 |l 


图 13-2 ”引用 JsonCpp 时 的 目录 树 


JsonCpp 主 要 包含 3 种 类 型 的 类 : Value、Reader、Writer。JsonCpp 中 所 有 对 象 、 类 名 都 在 命名 空间 JSON 中 ， 使 用 时 包含 json.h 即 可 。Json: : Value 是 JsonCpp 中 最 基本 、 最 重要 的 类 ， 用 于 表示 各 
种 类 型 的 对 象 ，JsonCpp 支 持 的 对 象 类 型 可 见 Json: : ValueType 枚 举 值 。 


例 13.1 中 ， 声 明了 一 个 Json: : Value 对 象 json_ temp， 并 赋值 了 2 个 key-value 对 : name: sharexu 及 age: 18， 代 码 如 下 : 


添加 一 个 数组 的 值 ， 用 append 函 数 即 可 ， 代 码 如 下 : 


root["key array"].append(1234); 





























Jsoncpp 的 Json: : Writer 类 是 一 个 纯 虚 类 ， 并 不 能 直接 使 用 。 在 此 使 用 Json: : Writer 的 子 类 : Json: : FastWriter, Json: : StyledWriter, Json: : StyledStreamWriter。 其 中 Json: : 
FastWriter 来 处 理 JSON 是 最 快 的 。 


























Json: :FastWriter fast writer; 
std::cout << fast writer.write (root); 





以 上 两 行 代码 的 执行 结果 是 : 


"key array": ['array string", 1234], "key boolean": false, "key double": 12.3450, "key number": 12345, "key object": ('age": 


18, "name": "sharexu"), "key string": "value string") 














Json: : StyledWriter 得 到 的 是 格式 化 后 的 JSON ， 下 面 来 看 看 Json: : StyledWriter 是 怎样 格式 化 的 ， 代 码 如 下 : 








Json::StyledWriter styled writer; 
std::cout «« styled writer.write (root); 


以 上 两 行 代码 的 执行 结果 是 : 





"key array" : [ "array string", 1234 ], 
"key boolean" : false, 

"key double" : 12.3450, 

"key number" : 12345, 

"key object" : ( 


"age" : 18, 
"name" : "sharexu" 
r 
"key_string" : "value_string" 


} 



























































Json: : Reader 是 用 于 读 取 的 ， 确 切 地 说 ， 是 用 于 将 字符 串 转换 为 Json: : Value 对 象 的。 下 面 就 是 把 str test 字符 串 转换 成 JSJON 对 象 value 的 。 注 意 ， 字 符 串 中 的 双 引 号 PHI (V) 进行 转 义 ， 
代码 如 下 : 

















string str test -"(V'idV":1, Vname V" : V'pacozhong V)"; 
Json::Reader reader; 
Json::Value value; 
if (!reader.parse(str test, value)) 
return 0; uu 


获取 JSON 对 象 中 的 元 素 的 值 有 2 种 方法 ， 比 如 value["name"].asString () 和 value["name"]， 代 码 如 下 : 





string value name-value["name"].asString(); 
cout ««value name««endl; 
cout ««value["name"]; 

















但 是 ， 用 as* 的 方法 取 值 时 ， 注 意 判 断 类 型 是 否 准确 ， 比 如 要 value["id"].aslnt () 取得 id 的 整 型 值 ， 就 得 先 判断 value["id"] 的 值 是否 是 整 型 的 ， 否 则 程序 可 能 产生 异常 ， 代 码 如 下 : 





if(!value["id"].isInt())( 
cout««"id is not int"««endl; 
Jelse( 
int value id-value["id"].asInt(); 
cout««value id««endl; 


} 























JSON 用 于 数据 传输 时 ， 基 本 上 是 先 转换 成 字符 串 形式 后 再 进行 传输 ， 使 用 方 拿 到 字符 串 后 再 解析 出 JSON ， 得 到 各 个 字段 的 内 容 。 


























3.JSON 用 途 














这 里 要 提 到 两 个 概念 ， 序 列 化 和 反 序 列 化 。 序 列 化 是 将 对 象 状态 转换 为 可 保持 或 传输 的 格式 的 过 程 。 与 序列 化 相对 的 是 反 序列 化 ， 它 将 流转 换 为 对 象 。 这 两 个 过 程 结合 起 来 ， 可 以 轻松 地 进行 数据 存储 
和 传输 。 























由 于 很 多 页 面 都 是 用 Java Script 写 的 ， 而 使 用 Java Script 解析 JSON 又 非常 方便 ， 所 以 很 多 CGI 都 是 用 JSON 与 页 面 进行 通信 的 。 























JSON 可 以 以 字符 串 的 形式 存储 ， 要 使 用 时 再 进行 序列 化 。 











13.2 Protobuf 








与 JSON 相 比 ，Protobuf 的 序列 化 和 反 序 列 化 的 速度 更 快 ， 而 且 传 输 的 数据 会 先 压 缩 ， 使 得 传输 的 效率 更 高 些 。 























Protobuf， 全 称 Protocol Buffer， 是 Google 公 司 内 部 的 混合 语言 数据 标准 ， 是 一 种 轻便 高 效 的 结构 化 数据 存储 格式 ， 可 以 用 于 结构 化 数据 串 行 化 ， 或 者 说 序列 化 。 它 很 适合 做 数据 存储 或 RPC 数 据 交 
换 格式 。Protobuf 是 可 用 于 通信 协议 、 数 据 存 储 等 领域 的 语言 无 关 、 平 台 无 关 、 可 扩展 的 序列 化 结构 数据 格式 。 目 前 提供 了 C++、Java、Python 三 种 语言 的 APl。 





















































1. 一 个 简单 的 例子 





















































使 用 Protobuf， 需 要 先 安装 得 到 protoc 文 件 ， 这 是 用 来 生成 头 文件 和 .cc 文件 的 工具 。 在 网 站 http://code.google.com/p/protobuf/downloads/list 上 可 以 下 载 Protobuf 的 源 代码 。 然 后 解压 、 编 译 
安装 便 可 以 使 用 它 了 。 
































安装 中 的 命令 步骤 如 下 所 示 。 





tar -xzf protobuf-2.5.0.tar.gz 

cd protobuf-2.5.0 

./configure --prefix- /home/sharexu/software/protobuf/protobuf-install 
make 

make check 

make install 























可 以 看 到 在 /home/sharexu/software/protobuf/protobuf-install 目 录 下 有 bin、include 和 lib 目录 。 可 以 把 include 目 录 下 的 文件 都 按照 该 目录 结构 和 |lib/libprotobuf.a 复 制 到 所 需要 的 目录 中 去 ， 这 




















样 就 可 以 开始 写 测试 程序 了 。 








【 例 13.2】 ”Protobuf 的 使 用 范例 。 











Mymessage.proto 的 代码 是 : 





package Im; 
message Content 
required int32 id = 1; // ID 
required string str - 2; // str 
optional int32 opt = 3; // optional field 


} 





Writer.cpp 的 代码 是 : 


#include<iostream> 
#include<fstream> 
#include "Mymessage.pb.h" 
using namespace std; 
int main(){ 
Im: :Content msgl; 
msgl.set id(101); 
msgl.set str("sharexu"); 
fstream output ("./1og", ios::out | ios::trunc | ios::binary); 
if (!msgl.SerializeToOstream(&output)) ( 
cerr «« "Failed to write msg." «« endl; 
return -1; 


return 0; 





Reader.cpp 的 代码 是 : 





#include<iostream> 
#include<fstream> 
#include "Mymessage.pb.h" 
using namespace std; 
void ListMsg (const Im::Content & msg) { 
cout << msg.id() << endl; 
cout << msg.str() << endl; 
} 
int main(int argc, char* argv[]){ 
Im: :Content msgl; 
fstream input("./log", ios::in | ios::binary); 
if (!msgl.ParseFromIstream(&input)) ( 
cerr «« "Failed to parse address book." «« endl; 
return -1; 
f 
ListMsg (msgl); 
return 0; 





makefile 的 代码 是 : 





INC-/home/sharexu/charpter13/1302/include 
LIB-/home/sharexu/charpter13/1302/lib 
lib-protobuf 
all:Writer Reader 
Writer.o:Writer.cpp 

g++ -g -c Writer.cpp -IS(INC) -L$(LIB) -l$ (lib) 
Reader.o:Reader.cpp 

g++ -g -c Reader.cpp -I$ (INC) -L$(LIB) -1$ (lib) 
Writer:Writer.o Mymessage.pb.o 

g++ -g -o Writer Writer.o Mymessage.pb.o -I$ (INC) -L$ (LIB) -1 
Reader:Reader.o Mymessage.pb.o 

g++ -g -o Reader Reader.o Mymessage.pb.o -I$(INC) -L$(LIB) -1 
Mymessage.pb.o:Mymessage.pb.cc 

g++ -g -c Mymessage.pb.cc -I$ (INC) -L$(LIB) -l$ (lib) 
Clean:Writer Reader Writer.o Reader.o Mymessage.pb.o 

rm Writer Reader Writer.o Reader.o Mymessage.pb.o 


$ (lib) 
$ (lib) 





执行 /home/sharexu/software/protobuf/protobuf-install/bin/protoc- 


Writer 和 Reader 文 件 。 执 行 ./Writer 命 令 后 ， 再 执行 ./Reader 命 令 ， 终 端 上 输出 : 


1=./--cpp_out=./Mymessage.proto 命 令 后 ， 会 生成 Mymessage.pb.h 和 Mymessage.pb.cc 文 件 。 再 执行 make 命 令 ， 生 成 








101 
sharexu 














例 13.2 的 程序 由 两 部 分 组 成 ， 第 一 部 分 被 称 为 Writer， 第 二 部 分 叫 作 Reader。Writer 负 责 将 一 些 结构 化 的 数据 写 入 一 个 磁盘 文件 ，Reader 则 负责 从 该 磁盘 文件 中 读 取 结构 化 数据 并 打印 到 屏幕 上 。 准 备 



































于 演示 的 结构 化 数据 是 Content， 它 包含 两 个 基本 数据 : @id， 为 一 个 整数 类 型 的 数据 ; @str， 是 一 个 字符 串 。 结 构 化 数据 是 定义 在 Mymessage.proto 文 件 中 的 。proto 文 件 非常 类 似 C++ 中 的 数据 定 


义 。Mymessage.proto 中 ， 定 义 了 一 个 消息 Content， 该 消息 有 3 个 成 员 : @@ 类 型 为 int32 的 id; @ 类 型 为 string 的 成 员 str; @opt 是 一 个 可 选 的 成 员 ， 即 消息 中 可 以 不 包含 该 成 员 。 





package Im; 
message Content 
{ 
required int32 id= 1; // ID 
required string str - 2; // str 
optional int32 opt = 3; // optional field 


} 











写 好 proto 文 件 之 后 就 得 用 Protobuf 编 译 器 将 该 文件 编译 成 目标 语言 了 。 执 行 /home/sharexu/software/protobuf/protobuf-instalybin/protoc-1=./--cpp_out=./Mymessage.proto 命 令 生 成 
Mymessage.pb.h 和 Mymessage.pb.cc 文 件 。Mymessage.pb.h 定 义 了 C++ 类 的 头 文件 Mymessage.pb.cc 文 件 定义 了 C++ 类 的 实现 文件 。 在 生成 的 头 文件 中 ， 定 义 了 一 个 C++ 类 Content， 后 面 的 Writer 
和 Reader 将 使 用 这 个 类 来 对 消息 进行 操作 。 诸 如 对 消息 的 成 员 进行 赋值 ， 将 消息 序列 化 等 都 有 相应 的 方法 。 












































Writer 将 把 一 个 结构 化 数据 写 入 磁盘 ， 以 便 其 他 用 户 来 读 取 。 假 如 不 使 用 Protobuf， 其 实 也 有 许多 其 他 的 选择 : 比如 可 以 将 数据 转换 为 字符 串 ， 然 后 将 字符 串 写 入 磁盘 。 转 换 为 字符 串 的 方法 可 以 使 












































sprintf () ， 这 非常 简单 。 数 字 123 可 以 变 成 字符 串 123。 这 样 做 似乎 没有 什么 不 受 ， 但 是 仔细 考虑 一 下 就 会 发 现 ， 这 样 的 做 法 对 Reader 的 要 求 比较 高 ，Reader 的 作者 必须 了 解 Writer 的 细节 。 比 
如 “123” 可 以 是 单个 数字 123， 但 也 可 以 是 3 个 数字 1、2 和 3， 等 等 。 这 么 说 来 ， 还 必须 让 Writer 定 义 一 种 分 隔 符 一 样 的 字符 ， 以 便 Reader 可 以 正确 读 取 。 最 后 发 现 一 个 简单 的 Content 也 需要 写 许多 处 理 












































消息 格式 的 代码 。 如 果 使 用 Protobuf， 那 么 这 些 细节 就 可 以 不 需要 应 用 程序 来 考虑 了 。 














Protobuf 使 Writer 的 工作 变 得 很 简单 ， 需 要 处 理 的 结构 化 数据 由 .proto 文 件 描述 ， 经 过 上 一 节 中 的 编译 过 程 后 ， 该 数据 化 结构 对 应 了 一 个 C++ 的 类 ， 并 定义 在 Mymessage.pb.h 中 。 对 于 本 例 ， 类 名 为 








Im: : Content。Writer 需 要 include 该 头 文件 ， 然 后 便 可 以 使 用 这 个 类 了 。 




















现在 在 Writer 代 码 中 ， 将 要 存 入 磁盘 的 结构 化 数据 由 一 个 Im: : Content 类 的 对 象 表示 ， 它 提供 了 一 系列 的 get/set 函 数 (field) 用 来 修改 和 读 取 结 构 化 数据 中 的 数据 成 员 。 














当 需 要 将 该 结构 化 数据 保存 到 磁盘 上 时 ， 类 Im: : Content 已 经 提供 相应 的 方法 来 把 一 个 复杂 的 数据 变 成 一 个 字 节 序列 ， 可 以 将 这 个 字 节 序列 写 入 磁盘 。 对 于 想 要 读 取 这 个 数据 的 程序 来 说 ， 也 只 需 
































Xim: : Content 的 相应 反 序 列 化 方法 来 将 这 个 字 节 序列 重新 转换 会 结构 化 数据 。 这 同 开始 时 那个 “123” 的 想法 类 似 ， 不 过 Protobuf 想 的 远 远 比 之 前 那个 粗糙 的 字符 串 转换 要 全 面 ， 因 此 ， 可 以 放心 














将 这 类 事情 交 给 Protobuf 。 





























下 面 是 定义 一 个 Im: : Content 对 象 ，set id () 用 来 设置 id 的 值 ， 代 码 如 下 : 














Im::Content msgl; 
msgl.set id(101); 
msgl.set str("hello"); 











下 面 把 msg1 的 内 容 序列 化 后 存储 当前 目录 的 log 文 件 中 。 其 中 SerializeToOstream 就 是 将 对 象 序列 化 ， 代 码 如 下 : 





fstream output("./log", ios::out | ios::trunc | ios::binary); 
if (!msgl.SerializeToOstream(&output)) ( 

cerr «« "Failed to write msg." «« endl; 

return -1; 


l 














而 对 于 Reader， 只 需要 从 log 文 件 中 读 取 ， 反 序列 化 后 就 能 获得 结构 化 的 数据 。Reader 声 明 类 helloworld 的 对 象 msg1， 然 后 利用 ParseFromlstream 从 一 个 fstream 流 中 读 取信 息 并 反 序 列 化 ， 代 码 如 


Im::Content msgl; 

fstream input("./log", ios::in | ios::binary); 

if (!msgl.ParseFromIstream(&input)) ( 
cerr << "Failed to parse address book." << endl; 
return -1; 


} 











此 后 ，ListMsg 中 采用 get 方 法 读 取 消息 的 内 部 信息 ， 并 进行 打印 输出 操作 ， 代 码 如 下 : 














void ListMsg(const Im::Content & msg)í 
cout «« msg.id() «« endl; 
cout «« msg.str() «« endl; 

} 


























这 个 例子 本 身 并 无 实际 意义 ， 但 只 要 稍 加 修改 就 可 以 将 它 变 成 更 加 有 用 的 程序 。 比 如 将 磁盘 蔡 换 为 网 络 socket， 那 么 就 可 以 实现 基于 网 络 的 数据 交换 任务 ， 而 存储 和 交换 正 是 Protobuf 最 有 效 的 应 用 领 














2. 高 效率 的 Protobuf 





Protobuf 的 高 效率 表现 在 以 下 两 个 方 





四 


























(1) Protobuf 序 列 化 后 的 信息 内 容 表示 非常 紧凑 ， 减 少 了 消息 的 体积 ， 自 然 只 需要 更 少 的 资源 。 比 如 网 络 上 传输 的 字 节 数 更 少 ， 需 要 的 10 设 备 更 少 等 ， 从 而 提高 性 能 。 











(2) Protobuf 封 解 包 的 速度 更 快 。 


13.3 EM 


本 章 从 数据 传输 和 压缩 的 角度 简单 介绍 了 JSON 和 Protobuf， 包 括 它 们 解决 了 什么 问题 和 它们 的 使 用 方法 等 。 比 JSON 的 效率 更 高 的 还 有 腾讯 的 开源 库 RapidJSON 等 ， 有 兴趣 的 读者 可 以 自行 了 解 。 


